登录
/
注册
首页
论坛
其它
首页
科技
业界
安全
程序
广播
Follow
关于
导读
排行榜
资讯
发帖说明
登录
/
注册
账号
自动登录
找回密码
密码
登录
立即注册
搜索
搜索
关闭
CSDN热搜
程序园
精品问答
技术交流
资源下载
本版
帖子
用户
软件
问答
教程
代码
写记录
写博客
小组
VIP申请
VIP网盘
网盘
联系我们
发帖说明
道具
勋章
任务
淘帖
动态
分享
留言板
导读
设置
我的收藏
退出
腾讯QQ
微信登录
1
2
/ 2 页
下一页
返回列表
首页
›
业界区
›
安全
›
读数据质量管理:数据可靠性与数据质量问题解决之道20读 ...
读数据质量管理:数据可靠性与数据质量问题解决之道20读后总结与感想兼导读
[ 复制链接 ]
岑韬哎
2025-6-10 23:45:35
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
1. 基本信息
数据质量管理:数据可靠性与数据质量问题解决之道
[美] 巴尔·摩西,[美] 利奥·加维什,[美] 莫莉· 著
机械工业出版社,2024年5月出版
1.1. 读薄率
书籍总字数18.8万字,笔记总字数61295字。
读薄率61295÷188000≈32.6%
1.2. 读厚方向
Data Mesh权威指南
数据的边界:隐私与个人数据保护
数据保护:工作负载的可恢复性
Julia数据科学应用
MLOps权威指南
数据自助服务实践指南:数据开放与洞察提效
商战数据挖掘:你需要了解的数据科学与分析思维
Spark快速大数据分析(第2版)
1.3. 笔记--章节对应关系
笔记章节字数发布日期
2024年读数据质量管理:数据可靠性与数据质量问题解决之道01数据质量第1章 为什么数据质量值得关注311711月12日读数据质量管理:数据可靠性与数据质量问题解决之道02数据湖仓第2章 对可靠数据系统的构建模块进行组装334511月13日读数据质量管理:数据可靠性与数据质量问题解决之道03数据目录第2章 对可靠数据系统的构建模块进行组装273411月14日读数据质量管理:数据可靠性与数据质量问题解决之道04收集与清洗第3章 收集、清洗、转换和测试数据328611月15日读数据质量管理:数据可靠性与数据质量问题解决之道05数据标准化第3章 收集、清洗、转换和测试数据346211月16日读数据质量管理:数据可靠性与数据质量问题解决之道06数据测试第3章 收集、清洗、转换和测试数据380211月17日读数据质量管理:数据可靠性与数据质量问题解决之道07异常检测第4章 数据管道的监控和异常检测220911月18日读数据质量管理:数据可靠性与数据质量问题解决之道08扩展异常检测第4章 数据管道的监控和异常检测373811月19日读数据质量管理:数据可靠性与数据质量问题解决之道09数据可靠性第5章 为数据可靠性进行架构设计327211月20日读数据质量管理:数据可靠性与数据质量问题解决之道10数据平台第5章 为数据可靠性进行架构设计363211月21日读数据质量管理:数据可靠性与数据质量问题解决之道11根因分析第6章 解决大规模数据质量问题331911月22日读数据质量管理:数据可靠性与数据质量问题解决之道12应对与缓解第6章 解决大规模数据质量问题266911月23日读数据质量管理:数据可靠性与数据质量问题解决之道13数据沿袭第7章 构建端到端的数据沿袭347611月24日读数据质量管理:数据可靠性与数据质量问题解决之道14普及数据质量第8章 推广和普及数据质量319311月25日读数据质量管理:数据可靠性与数据质量问题解决之道15数据信任第8章 推广和普及数据质量289011月26日读数据质量管理:数据可靠性与数据质量问题解决之道16数据认证第8章 推广和普及数据质量429611月27日读数据质量管理:数据可靠性与数据质量问题解决之道17数据网格第9章 现实世界中的数据质量:对话和案例分析334611月28日读数据质量管理:数据可靠性与数据质量问题解决之道18数据发现第9章 现实世界中的数据质量:对话和案例分析282111月29日读数据质量管理:数据可靠性与数据质量问题解决之道19数据未来第10章 开创可靠数据系统的未来268811月30日$总计61295$
2.
亮点
2.1 数据标准化很重要
标准化通常是你的数据在管道中经过的诸多此类转换中的第一个
非常重要
2.2 数据测试
数据测试的两个最佳工具分别是dbt测试和Great Expectation
2.3 数据沿袭
通俗点说,就是来龙去脉
2.4 数据信任
重中之重,不可信,有何用?
其实,也是很有用的。。。。。
比如,米国的那些非农啊、就业啊等等数据操控之用(冠冕堂皇地说法,预期管理)
3.
感想
3.1 总结要及时
总结一定要及时啊,因为时间长了,容易忘
但是,换一个说法,就是没有忘的,就是沉淀下来的精华啊
3.2 数据工程越来越重要
随着时代的发展,AI是数据需求的重头戏,而数据工程是保障数据质量的关键环境,“垃圾进,垃圾出“,数据工程势必占据越来越重要的地位
3.3 数据质量保障是一个长期、持续的过程
只要有数据产生,就要保障数据质量,不会一劳永逸,只会持续不断跟进
3.4 数据信任和操控
前文提到了数据操控,其实还是基于数据信任的
为什么要数据操控?是因为数据不符合预期。
为什么会认为数据不符合预期?是因为相信数据得到的结果,还是要信任啊。
也许你会说,样本取样的问题?为什么样本取样有问题?为什么不全面取样?是不能还是不敢,亦或是不为
修正前期的数据又为啥?
3.5 好书,推荐阅读
来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
数据
质量管理
可靠性
质量
问题
相关帖子
最小二乘问题详解14:鲁棒估计与5点算法求解本质矩阵
数据网络小知识-VLAN基础及延伸技术简介
C语言基本数据类型与类型提升机制
实时数据平台的价值链——数据采集、加工、存储、查询与消费的协同效应与ROI评估
最小二乘问题详解16:束平差工程实践总结
vue vxe-table 数据分组与排序的实现方式
ITR合集 | 从问题到解决:燕千云5大经典客户案例分析
算法竞赛小trick:将区间问题转化为前缀和相减
打破运维数据孤岛:燕千云平台CMDB运维监控一体化解决方案
【译】 数据摄取构建模块简介(预览版)(一)
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
照妖镜
相关推荐
业界
最小二乘问题详解14:鲁棒估计与5点算法求解本质矩阵
0
513
吉娅寿
2026-03-09
业界
数据网络小知识-VLAN基础及延伸技术简介
0
241
髭赌
2026-03-09
安全
C语言基本数据类型与类型提升机制
0
32
迭婵椟
2026-03-11
安全
实时数据平台的价值链——数据采集、加工、存储、查询与消费的协同效应与ROI评估
0
27
顶豌
2026-03-13
业界
最小二乘问题详解16:束平差工程实践总结
0
25
栓州
2026-03-14
代码
vue vxe-table 数据分组与排序的实现方式
0
30
羊舌正清
2026-03-14
安全
ITR合集 | 从问题到解决:燕千云5大经典客户案例分析
0
388
史华乐
2026-03-14
业界
算法竞赛小trick:将区间问题转化为前缀和相减
0
27
归悦可
2026-03-14
安全
打破运维数据孤岛:燕千云平台CMDB运维监控一体化解决方案
0
848
胆饬
2026-03-18
业界
【译】 数据摄取构建模块简介(预览版)(一)
0
146
遗憩
2026-03-21
回复
(29)
尝琨
2025-11-26 18:27:14
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
很好很强大 我过来先占个楼 待编辑
费卿月
2025-12-30 15:00:12
回复
使用道具
举报
照妖镜
程序园永久vip申请,无限下载程序园所有程序/软件/数据/等
热心回复!
癖艺泣
2026-1-8 18:39:13
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
感谢分享,学习下。
利怡悦
2026-1-14 07:43:30
回复
使用道具
举报
照妖镜
程序园永久vip申请,无限下载程序园所有程序/软件/数据/等
东西不错很实用谢谢分享
郏琼芳
2026-1-17 21:54:54
回复
使用道具
举报
照妖镜
程序园永久vip申请,无限下载程序园所有程序/软件/数据/等
谢谢分享,试用一下
滕佩杉
2026-1-18 00:17:53
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
这个有用。
髭赌
2026-1-21 04:48:08
回复
使用道具
举报
照妖镜
程序园永久vip申请,无限下载程序园所有程序/软件/数据/等
喜欢鼓捣这些软件,现在用得少,谢谢分享!
任静柔
2026-1-23 08:37:48
回复
使用道具
举报
照妖镜
程序园永久vip申请,无限下载程序园所有程序/软件/数据/等
用心讨论,共获提升!
材部
2026-1-26 07:02:02
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
感谢分享
柄利
2026-1-27 05:59:11
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
感谢分享,学习下。
杜优瑗
2026-1-28 16:55:01
回复
使用道具
举报
照妖镜
程序园永久vip申请,无限下载程序园所有程序/软件/数据/等
新版吗?好像是停更了吧。
郗新语
2026-1-30 16:51:14
回复
使用道具
举报
照妖镜
程序园永久vip申请,无限下载程序园所有程序/软件/数据/等
分享、互助 让互联网精神温暖你我
事值
2026-2-4 09:55:16
回复
使用道具
举报
照妖镜
程序园永久vip申请,无限下载程序园所有程序/软件/数据/等
谢谢分享,辛苦了
于映雪
2026-2-4 20:13:48
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
新版吗?好像是停更了吧。
俞秋荣
2026-2-5 10:24:30
回复
使用道具
举报
照妖镜
程序园永久vip申请,无限下载程序园所有程序/软件/数据/等
这个有用。
章娅萝
2026-2-8 08:05:58
回复
使用道具
举报
照妖镜
程序园永久vip申请,无限下载程序园所有程序/软件/数据/等
谢谢分享,辛苦了
闻成
2026-2-8 15:16:36
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
感谢分享
骆贵
2026-2-9 06:50:14
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
不错,里面软件多更新就更好了
碣滥
2026-2-9 15:10:31
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
感谢分享
下一页 »
1
2
/ 2 页
下一页
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
回复
本版积分规则
回帖并转播
回帖后跳转到最后一页
签约作者
程序园优秀签约作者
发帖
岑韬哎
2026-2-9 15:10:31
关注
0
粉丝关注
29
主题发布
板块介绍填写区域,请于后台编辑
财富榜{圆}
3934307807
991125
anyue1937
9994892
kk14977
6845359
4
xiangqian
638210
5
神泱
9522
6
韶又彤
9912
7
宋子
9878
8
荪俗
9016
9
闰咄阅
9995
10
刎唇
9995
查看更多
今日好文热榜
630
AI编程时代,35岁以上程序员将何去何从?
826
[Refactor]CPP Learn Data Day 1
0
Block Copy 的内存布局详解
613
把 Flask 搬进 ESP32,高中生自研嵌入式 We
1
渐得如意智能自动化办公平台——定义属于你
883
[AI/Agent/社交] AI Agent社交网络产品:Mo
520
C++协程入门
284
TCSSOFTDEPTCOPY.zip Can download source
800
Vue3 + Iframe 实战:打造企业级流程配置中
823
“你用AI,那我也会用AI,我还要你干什么?
621
自感痕迹论:先验意义场域与经验痕迹内外
7
一道KMP统考真题彻底讲透:nextval与滑动距
6
一道KMP统考真题彻底讲透:nextval与滑动距
741
从 Clubhouse 的崛起与陨落,看语聊房 RTC
244
老马失前蹄,竟然在数据库外键上翻车了,重
8
老马失前蹄,竟然在数据库外键上翻车了,重
6
老马失前蹄,竟然在数据库外键上翻车了,重
6
老马失前蹄,竟然在数据库外键上翻车了,重
8
老马失前蹄,竟然在数据库外键上翻车了,重
7
老马失前蹄,竟然在数据库外键上翻车了,重