登录
/
注册
首页
论坛
其它
首页
科技
业界
安全
程序
广播
Follow
关于
导读
排行榜
资讯
发帖说明
登录
/
注册
账号
自动登录
找回密码
密码
登录
立即注册
搜索
搜索
关闭
CSDN热搜
程序园
精品问答
技术交流
资源下载
本版
帖子
用户
软件
问答
教程
代码
写记录
写博客
小组
VIP申请
VIP网盘
网盘
联系我们
发帖说明
道具
勋章
任务
淘帖
动态
分享
留言板
导读
设置
我的收藏
退出
腾讯QQ
微信登录
返回列表
首页
›
业界区
›
安全
›
当数据库世界重新讨论文件格式:TsFile 与工业高质量数 ...
当数据库世界重新讨论文件格式:TsFile 与工业高质量数据集的背后逻辑
[ 复制链接 ]
琉艺戕
昨天 12:55
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
在《2025 数据库世界年度回顾》中,TsFile 等文件格式正在重新引发数据库系统的关注。
最近,CMU(Carnegie Mellon University,卡耐基梅隆大学)数据库系统领域的重要代表人物 Andy Pavlo,发布了他一年一度的《2025 数据库世界年度回顾》。
作为长期参与并观察数据库系统演进的学者,他的年度回顾常被业界视为判断技术走向的重要参考。
在这篇年度回顾中,一个耐人寻味的现象被明确点出:文件格式这一长期相对沉寂的技术领域,正在重新进入数据库系统的关键技术讨论范围,并逐渐引发更多关注。多个新的开源文件格式在短时间内集中出现,试图从不同路径回应数据长期演进、互操作性与新硬件环境带来的挑战。
在文章中,TsFile 与多个来自学界和工业界的新一代开源文件格式一起,被列入近两年出现的重要尝试之中。
这并不是一次产品评测,而是一种趋势层面的判断——文件格式,正在从“实现细节”重新回到“系统基础设施”的位置。
报告原文:https://www.cs.cmu.edu/~pavlo/blog/2026/01/2025-databases-retrospective.html
为什么会出现这样的变化?
过去十多年里,数据库系统的关注点更多集中在查询引擎、执行框架与分布式架构上,而文件格式一度被视为相对成熟、变化缓慢的领域。但随着工业场景与 AI 应用的深入,这一前提正在被打破。
在越来越多真实生产环境中,新的问题变得突出:
数据从终端设备产生,并汇聚到云端进行分析;
数据需要在不同系统、语言和工具之间反复使用;
数据不仅服务于查询,也直接服务 AI 模型训练与推理。
在这样的背景下,“数据是否具备长期可用性与可复用性”,开始变得更加重要。这也是我们近期反复讨论“工业高质量数据集”的原因。
当数据生命周期被拉长到十年甚至更久时,文件格式不再只是存储效率问题,而成为承载时间语义、元数据、演进能力的基础载体。
TsFile 正是在这样的需求背景下逐步演进而来。它并非为某一个查询引擎而生,而是试图回答一个更基础的问题:工业时序数据,如何被稳定、清晰、长期地保存,并在未来不断被重新理解和利用。
从这个角度看,文件格式在数据库世界中重新引发广泛讨论,并不令人意外。它反映的不是某一个项目的变化,而是整个行业对“数据长期价值”的重新认识。
点击访问 TsFile 官网,了解更多技术详情!
来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
数据库
世界
重新
讨论
文件
相关帖子
瑞萨回读hex文件对比数据(因格式不一致)
手把手搞定FastAPI静态文件:安全、上传与访问
Ubuntu下编辑文本文件的方法
向量数据库多云部署方案与架构设计优化——作业帮AI业务的数据底座
UOS环境C#/Avalonia将文件剪切到剪切(粘贴)板实现
JuiceFS 2025:迈入千亿文件规模,开源第五年持续高速增长
新版微信4.1及以上dat文件转图片
GrralVM25打包SpringBoot成可执行文件Native-Image最佳实践
ctfshow-web文件包含(web78-web86)
国产芯 × 数据库,全球性能夺冠!
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
照妖镜
相关推荐
安全
瑞萨回读hex文件对比数据(因格式不一致)
0
5
肿抢
2025-12-31
业界
手把手搞定FastAPI静态文件:安全、上传与访问
1
702
乳杂丫
2026-01-02
业界
Ubuntu下编辑文本文件的方法
2
246
当贵
2026-01-03
科技
向量数据库多云部署方案与架构设计优化——作业帮AI业务的数据底座
0
87
接快背
2026-01-04
业界
UOS环境C#/Avalonia将文件剪切到剪切(粘贴)板实现
0
575
倡遍竽
2026-01-05
业界
JuiceFS 2025:迈入千亿文件规模,开源第五年持续高速增长
0
969
恐肩
2026-01-05
业界
新版微信4.1及以上dat文件转图片
0
627
士沌
2026-01-06
业界
GrralVM25打包SpringBoot成可执行文件Native-Image最佳实践
1
684
济曝喊
2026-01-06
安全
ctfshow-web文件包含(web78-web86)
0
146
娥搽裙
2026-01-08
安全
国产芯 × 数据库,全球性能夺冠!
0
515
蒋炸役
2026-01-09
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
回复
本版积分规则
回帖并转播
回帖后跳转到最后一页
签约作者
程序园优秀签约作者
发帖
琉艺戕
昨天 12:55
关注
0
粉丝关注
20
主题发布
板块介绍填写区域,请于后台编辑
财富榜{圆}
3934307807
991124
anyue1937
9994891
kk14977
6845358
4
xiangqian
638210
5
韶又彤
9992
6
宋子
9978
7
闰咄阅
9993
8
刎唇
9993
9
俞瑛瑶
9998
10
蓬森莉
9946
查看更多
今日好文热榜
941
搭建你的个人图床
192
obet快速修改scn/resetlogs恢复数据库(缺少
246
Thread 类的基本用法、Java 线程的几种状态
994
MQTT状态管理Vuex全局状态管理
127
初识Tauri
924
源码独立部署成企业数据安全新选择 广州旗
140
一款基于 .NET 9 构建的企业级 Web RBAC 快
361
2026.1.9日闲话:DAG 计数
433
Git使用经验总结9-Git提交关联到Issue
270
盘点北京地区都有哪些值得推荐的陪诊机构
796
ftrace可视化工具迎来重大升级
741
2026年质量领先的装配式内装品牌盘点:华耐
877
Flink源码阅读:Task数据交互
903
公众号推荐机制整理:科技号怎么把社交流量
336
混合检索(Hybrid Search):多模态检索实
102
12个JS核心,搞懂这些直接起飞!
270
MAF快速入门(11)并行工作流
365
vxe-table 复制单元格内容总会在最后加个换
726
Python描述器(Descriptor)深度解析:OOP
267
AI生成式技术驱动企业获客革新:广州旗引科