登录
/
注册
首页
论坛
其它
首页
科技
业界
安全
程序
广播
Follow
关于
导读
排行榜
资讯
发帖说明
登录
/
注册
账号
自动登录
找回密码
密码
登录
立即注册
搜索
搜索
关闭
CSDN热搜
程序园
精品问答
技术交流
资源下载
本版
帖子
用户
软件
问答
教程
代码
写记录
写博客
小组
VIP申请
VIP网盘
网盘
联系我们
发帖说明
道具
勋章
任务
淘帖
动态
分享
留言板
导读
设置
我的收藏
退出
腾讯QQ
微信登录
返回列表
首页
›
业界区
›
安全
›
主流关系型数据库系统缺陷实证研究——OceanBase 校企联 ...
主流关系型数据库系统缺陷实证研究——OceanBase 校企联合研究
[ 复制链接 ]
吕清莹
4 天前
程序园永久vip申请,500美金$,无限下载程序园所有程序/软件/数据/等
摘要:
OceanBase联合中国人民大学数据库团队的数据库缺陷实证研究,被软件工程顶刊IEEE TSE录用。该研究首次构建了面向开源关系型数据库的细粒度缺陷分类体系,共获得12 项发现,为RDBMS系统的开发维护和测试提供了重要启示。研究发现,涉及SQL数据类型及数据库触发器、存储过程、参数设置等复杂功能的缺陷现有测试工作无法有效触发,这一发现为提升RDBMS缺陷检测能力提供了显著改进空间。
日前,由 OceanBase 联合中国人民大学数据库系统研究团队(刘爽副教授)对主流关系型数据库系统缺陷开展的实证研究《A Comprehensive Study of Bugs in Relational DBMS》被软件工程领域顶级期刊 IEEE Transactions on Software Engineering(TSE) 正式录用。
IEEE TSE 是 IEEE 旗下软件工程方向的权威期刊。在数据库缺陷实证研究方面,本论文首次系统分析了 MySQL 等三个开源数据库中 777 个真实缺陷,揭示了 RDBMS 的缺陷在根因、表症等方面的特点,以及现有测试工具在深层语义缺陷检测上的局限性。
以下为论文介绍。
简 介
本研究通过“系统性实证分析”揭示主流关系型数据库在真实场景中的缺陷规律。研究覆盖 MySQL、SQLite 和 openGauss 三大系统中 777 个高质量修复缺陷,深入剖析其根本原因、症状表现、分布特征及其关联性。
其核心贡献在于:首次构建了面向开源关系型数据库的细粒度缺陷分类体系,研究共获得 12 项发现,为 RDBMS 系统的开发维护和测试提供了重要启示。研究发现,涉及 SQL 数据类型及数据库触发器、存储过程、参数设置等复杂功能的缺陷现有测试工作无法有效触发,这一发现为提升 RDBMS 缺陷检测能力提供了显著改进空间。
方法与分类体系
表1:采集 bug 的统计信息
本研究通过一套严谨的实证方法对关系型数据库中的真实缺陷进行系统性分类与归因。围绕三个核心维度展开:根因、症状和修复模块。研究团队从 MySQL、SQLite 和 openGauss 的官方仓库中收集了 2018 至 2023 年间报告的 2495 个缺陷,经过严格筛选后构建了一个高质量的 777 个缺陷数据集。
在此基础上,作者提出了一套四维分析框架:
根因维度识别出 12 类根本问题(如错误逻辑、API 误用、类型处理缺陷等);
症状维度归纳了包括错误结果、崩溃、死锁、性能退化等行为;
模块维度定位缺陷修复位置(如解析器、优化器、执行引擎、存储层等);
关联性进一步探索三者之间的关联规律,例如“类型相关根因多导致错误结果,且集中于表达式求值模块”。
为确保标注一致性,两名研究人员独立完成全部标签分配,并通过 Cohen’s Kappa 系数评估达成共识。该方法不仅保证了分析的客观性,也为后续数据库测试工具的设计提供了可操作的指导依据。
结果与分析
研究揭示了多项关键发现。首先,在根因分布上,“不正确的代码逻辑”占比最高达 32.3%,“类型处理缺陷”和“API 误用”分别以9.0% 和 8.4% 的比例成为第二、第三大类根因。其次,在症状表现方面,“结果不一致”是最普遍的症状,占全部缺陷的42.99%,且往往无崩溃、无报错,具有极强的隐蔽性。
图1:按根本原因划分的缺陷分布
进一步的跨系统对比显示:MySQL 与 SQLite 在缺陷模式上高度相似,而 openGauss 因架构差异与活跃开发状态,表现出显著不同的缺陷谱系。这些结果不仅刻画了数据库内核的脆弱面,也为未来高可靠数据库的设计与质量保障工作指明了方向。
图2:症状与根因的关系
概念验证工具 SQLT
研究中观察到类型相关缺陷在数据库 bug 中占比显著,团队开发了一个概念验证工具 SQLT,用于针对性挖掘此类问题。SQLT 强化了对跨数据类型表达式、隐式类型转换以及非标准类型(如 BIT、JSON)组合的查询生成能力。
该工具通过比对语义等价查询的执行结果,能够有效识别那些不触发崩溃但返回错误结果的静默逻辑缺陷。在实验中,SQLT 不仅成功复现了多个已知类型 bug,还新发现 8 个此前未被报告的问题,其 5 个已被 MySQL、SQLite 和 openGauss 官方确认并修复。
表2:SQLT检测到的缺陷
欢迎访问 OceanBase 官网获取更多信息:
https://www.oceanbase.com/
来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
研究
主流
关系型
数据库
系统
相关帖子
OceanBase 再获“中国分布式数据库本地部署市场之首”
为什么你用了向量数据库,系统反而更复杂了
时序数据库 Apache IoTDB 入选国家重点研发计划高新技术成果产业化试点
时序数据库 Apache IoTDB 入选国家重点研发计划高新技术成果产业化试点
时序数据库 Apache IoTDB 入选国家重点研发计划高新技术成果产业化试点
抖音数据采集方案研究:从 API 逆向到 WebSocket 环境注入
深度探秘 Apache DolphinScheduler 数据库模式
关于类 UNIX 系统的学习路线图
关于类 UNIX 系统的学习路线图
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
照妖镜
相关推荐
安全
OceanBase 再获“中国分布式数据库本地部署市场之首”
4
864
获弃
2026-01-27
科技
为什么你用了向量数据库,系统反而更复杂了
0
10
胰芰
2026-01-28
安全
时序数据库 Apache IoTDB 入选国家重点研发计划高新技术成果产业化试点
0
6
后沛若
2026-01-28
安全
时序数据库 Apache IoTDB 入选国家重点研发计划高新技术成果产业化试点
1
10
菅舛
2026-01-28
安全
时序数据库 Apache IoTDB 入选国家重点研发计划高新技术成果产业化试点
1
7
删一
2026-01-28
业界
抖音数据采集方案研究:从 API 逆向到 WebSocket 环境注入
2
724
娄静曼
2026-01-28
安全
深度探秘 Apache DolphinScheduler 数据库模式
0
2
豹筒生
2026-01-28
业界
关于类 UNIX 系统的学习路线图
0
587
左优扬
2026-01-30
业界
关于类 UNIX 系统的学习路线图
1
163
酒跚骼
2026-01-30
回复
(2)
郗新语
3 天前
回复
使用道具
举报
照妖镜
程序园永久vip申请,500美金$,无限下载程序园所有程序/软件/数据/等
感谢发布原创作品,程序园因你更精彩
聊账
昨天 04:17
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
谢谢分享,试用一下
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
回复
本版积分规则
回帖并转播
回帖后跳转到最后一页
浏览过的版块
科技
业界
签约作者
程序园优秀签约作者
发帖
吕清莹
昨天 04:17
关注
0
粉丝关注
21
主题发布
板块介绍填写区域,请于后台编辑
财富榜{圆}
3934307807
991124
anyue1937
9994892
kk14977
6845359
4
xiangqian
638210
5
宋子
9939
6
韶又彤
9952
7
闰咄阅
9993
8
刎唇
9995
9
蓬森莉
9921
10
俞瑛瑶
9998
查看更多
今日好文热榜
541
上传本地文件到linux服务器的三种方法对比
932
用 Vue3 + fetch-event-source 打造流式 AI
754
吴恩达深度学习课程五:自然语言处理 第三
812
Java中的数据类型
499
Google正式上线Gemini In Chrome,国内环境
169
天翼云全面上线Moltbot,通过云主机、AI云
518
10408_基于SSM的野营用品租赁管理系统
329
10408_基于SSM的野营用品租赁管理系统
2
10408_基于SSM的野营用品租赁管理系统
1
10408_基于SSM的野营用品租赁管理系统
2
10408_基于SSM的野营用品租赁管理系统
2
10408_基于SSM的野营用品租赁管理系统
2
10408_基于SSM的野营用品租赁管理系统
2
10408_基于SSM的野营用品租赁管理系统
2
10408_基于SSM的野营用品租赁管理系统
2
10408_基于SSM的野营用品租赁管理系统
2
10408_基于SSM的野营用品租赁管理系统
2
10408_基于SSM的野营用品租赁管理系统
823
Codes 采用需求池+引用+导入,这三招创新性
16
拆解一个由 setTimeout 引发的“页面假死”