登录
/
注册
首页
论坛
其它
首页
科技
业界
安全
程序
广播
Follow
关于
导读
排行榜
资讯
发帖说明
登录
/
注册
账号
自动登录
找回密码
密码
登录
立即注册
搜索
搜索
关闭
CSDN热搜
程序园
精品问答
技术交流
资源下载
本版
帖子
用户
软件
问答
教程
代码
写记录
写博客
小组
VIP申请
VIP网盘
网盘
联系我们
发帖说明
道具
勋章
任务
淘帖
动态
分享
留言板
导读
设置
我的收藏
退出
腾讯QQ
微信登录
返回列表
首页
›
业界区
›
科技
›
读当我点击时,算法在想什么?03算法在监视我们(下) ...
读当我点击时,算法在想什么?03算法在监视我们(下)
[ 复制链接 ]
咒卖箴
2025-6-7 13:24:51
程序园永久vip申请,500美金$,无限下载程序园所有程序/软件/数据/等
1. 没有公平,只有悖论
1.1. 这个世界上不存在公平的方程式
1.2. 公平只是人类的美好愿望,它是我们的一种感觉
1.3. 数学的美妙之处在于我们可以通过它证明普适的结论
1.3.1. 每当我们为了做正确的事情而向数学求助的时候,它给我们的答案始终如一:公平不止源于逻辑
1.4. 肯尼斯·阿罗(Kenneth Arrow)的“不可能性定理”(impossibility theorem)告诉我们,不存在一个制度能够让人们在三个政治候选人之间进行选择时,又公平地反映所有投票者的喜好
1.5. “不作恶”(Don’tbe evil),但现在谷歌公司却不怎么提它
1.6. 我们可以全力以赴,但永远无法确定我们所做的事情就是正确的
1.7. 算法中的偏见与歧视
1.7.1. 不太担心算法会对我们做出精确得可怕的预测,而是更担心人们推销算法的方法
1.7.2. 误报
1.7.2.1. False Positive,也称假阳性
1.7.3. 漏报
1.7.3.1. False Negative,也称假阴性
1.7.4. 当我们生活在一个方方面面都不公平的世界中时,我们就不能指望我们的算法完全公平
2. COMPAS算法
2.1. COMPAS是一个黑箱,这意味着人们很难,甚至无法对其内部一探究竟
2.2. COMPAS算法的发明人蒂姆·布伦南(Tim Brennan)是该算法的供应商Northpointe公司的董事
2.3. 首先使用主成分分析法旋转和降维数据,然后使用根据过往记录做出的回归模型来预测某个犯人是否会再次犯罪
2.4. 差异本身并不意味着该算法存在偏见,因为在黑人和白人犯人中,再次犯罪的比例有所不同
2.4.1. 52.6%的黑人罪犯在两年内因另一项罪行被逮捕
2.4.2. 仅有 39.4%的白人罪犯因另一项罪行被抓
2.5. 误报指的是一个不会在未来犯罪的人被列为高风险罪犯的情况,也就是说模型做出了肯定却错误的预测
2.5.1. 误报却意味着你可能被拒绝假释或者被判比应得刑期更长的监禁时间
2.6. 误报率指那些没有再次犯罪却被列为高风险罪犯的人数除以未再犯的总人数
2.7. 真阳性(True Positive)的判断是公平的:算法预测你存在犯罪风险,而你也确实如此
2.8. 发生在白人罪犯身上的则更多的是漏报,即某个人被归入了低风险人群,但他却再次犯罪
2.8.1. 白人罪犯的漏报率是461/966≈47.7%
2.8.2. 黑人罪犯则是 532/1 901≈28.0%
2.9. 高漏报率意味着很多本应被拘留的人却重新获得自由并犯下了罪行,这对于社会来说是一个严重问题
2.9.1. 几乎有一半再次犯罪的白人在评估中被算法贴上了低风险的标签
2.10. 黑人有可能因为它被无辜地判以更久的刑期,而会犯下更多罪行的白人则被释放
2.11. 任何其他结果都表明这个算法对这两个种族做了不公平的校准,因为那意味着它必须对白人和黑人罪犯使用不同的评估方法
3. 数据炼金术士
3.1. 算法在数以百计的维度中“思考”,处理海量数据,并了解我们的行为
3.2. 当需要理解这个世界的时候,数学模型通常战胜不了人类
3.3. 主观属性可以通过听歌环节进行量化,在这个过程中人类实验对象会聆听成组的歌曲,并说出他们认为最悲伤或最适合跳舞的一首歌
3.4. 数据炼金术这个概念完美地体现了现代数字营销的运作方式
3.5. 最简单的方法往往就是最好的
3.6. 关于公司滥用私人信息的阴谋论不太可能站得住脚
3.6.1. 更合理的解释是,数据炼金术士们发现了我们行为中的统计关系,并帮助这些公司向我们推送定向广告
3.7. “阴魂不散”的广告还有另一个主要来源,那就是重定向
3.7.1. 我们搜索过阿尔加维的旅行,只是忘记了
3.7.2. 但是网络浏览器却已经记住这些信息并反馈给了XY集团,于是后者根据这些信息为我们推荐最好的酒店房间
3.8. 我们长时间盯着我们的手机和屏幕,这使得广告似乎能够不时地读懂我们的想法
3.9. 真正聪明的并不是算法
3.9.1. 这些才智来自数据炼金术士,他们把数据和自己对客户的理解相结合
3.9.2. 由于算法的预测依赖于点“赞”的数据,它对我们行为的预测,在精确性上不及我们身边的人
3.9.3. 只有被了解其局限性的人使用,算法才能发挥它最大的作用
4. 业余人士打败了算法
4.1. 人类总是理所当然地认为技术是客观公正的,所以那些技术未能带来公正的时候往往是最危险的时候
4.2. 一个被广泛用于预测再犯的大型商业软件,并不比那些几乎没有刑事审判经验的人根据在线调查问卷结果所做的预测更准确、更公平
4.3. 结论并不意味着算法毫无用武之地
4.3.1. 如果算法的表现与人类的水平相同,那么计算机就会获胜,因为它们处理数据的速度远非人类可比
4.3.2. 模型虽然远远不够完美,但确实非常有用
4.4. 对许多犯人来说,接受面谈和评估是一个有损人格的过程,然而这个过程似乎并没有提高再犯率预测的水平
来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
算法
读当
点击
在想
什么
相关帖子
朴素贝叶斯算法预测中文钓鱼邮件
目标追踪算法+卡尔曼滤波原理+ByteTrack使用
查找算法
什么是负载均衡?不就是加台服务器嘛!
画高保真原型图用什么软件?产品经理与设计师的选型思路
【分析式AI】-朴素贝叶斯算法模型
【分析式AI】-朴素贝叶斯算法模型
负载均衡的概念、分类、算法、健康检查机制及高可用解决方案
字符串匹配算法
LLL与BKZ算法
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
照妖镜
相关推荐
业界
朴素贝叶斯算法预测中文钓鱼邮件
0
663
坠矜
2025-12-08
业界
目标追踪算法+卡尔曼滤波原理+ByteTrack使用
1
484
娥搽裙
2025-12-09
业界
查找算法
2
58
崔瑜然
2025-12-12
业界
什么是负载均衡?不就是加台服务器嘛!
0
22
卜笑
2025-12-15
安全
画高保真原型图用什么软件?产品经理与设计师的选型思路
0
880
狭踝仇
2025-12-16
业界
【分析式AI】-朴素贝叶斯算法模型
1
247
跑两獗
2025-12-16
业界
【分析式AI】-朴素贝叶斯算法模型
1
305
巫雪艷
2025-12-16
安全
负载均衡的概念、分类、算法、健康检查机制及高可用解决方案
0
308
渭茱瀑
2025-12-16
业界
字符串匹配算法
0
26
旌磅箱
2025-12-17
安全
LLL与BKZ算法
0
637
宓碧莹
2025-12-19
回复
(2)
纪睐讦
2025-12-7 05:41:51
回复
使用道具
举报
照妖镜
程序园永久vip申请,500美金$,无限下载程序园所有程序/软件/数据/等
用心讨论,共获提升!
都淑贞
6 天前
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
这个好,看起来很实用
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
回复
本版积分规则
回帖并转播
回帖后跳转到最后一页
浏览过的版块
代码
签约作者
程序园优秀签约作者
发帖
咒卖箴
6 天前
关注
0
粉丝关注
23
主题发布
板块介绍填写区域,请于后台编辑
财富榜{圆}
3934307807
991124
anyue1937
9994892
kk14977
6845358
4
xiangqian
638210
5
韶又彤
9997
6
宋子
9981
7
闰咄阅
9993
8
刎唇
9993
9
俞瑛瑶
9998
10
蓬森莉
9950
查看更多
今日好文热榜
411
Github项目CI&CD部署
310
AgentScope深入分析-LLM&MCP
597
《痞子衡嵌入式半月刊》 第 120 期
624
go项目使用go build 与 MakeFile 构建项目
764
监控指标与容量预警——延迟、命中率、慢查
673
2026 年别墅防水服务商 TOP5 推荐:高端住
963
MAUI库推荐二:MPowerKit
962
.NET10 New feature 新增功能介绍-JIT编译
404
报考陪诊师选守嘉陪诊的理由
272
C#AI系列(7):从零开始LLM之Tokenizer实现
286
C#AI系列(7):从零开始LLM之Tokenizer实现
827
Pytest 测试用例自动生成:接口自动化进阶
848
一天一个Python库:NumPy - 科学计算的基石
15
FFmpeg 内存输入&输出
745
一文读懂RAG架构如何助力AI
500
一文读懂RAG架构如何助力AI
549
ROS2之TF介绍
400
SW 随笔 001 — InlineArray 带你飞(Since
693
当遇见 CatchAdmin V5-模块化设计重新定义
495
【有手就行】SWIFT:花20分钟把大模型的名