登录
/
注册
首页
论坛
其它
首页
科技
业界
安全
程序
广播
Follow
关于
导读
排行榜
资讯
发帖说明
登录
/
注册
账号
自动登录
找回密码
密码
登录
立即注册
搜索
搜索
关闭
CSDN热搜
程序园
精品问答
技术交流
资源下载
本版
帖子
用户
软件
问答
教程
代码
写记录
写博客
小组
VIP申请
VIP网盘
网盘
联系我们
发帖说明
道具
勋章
任务
淘帖
动态
分享
留言板
导读
设置
我的收藏
退出
腾讯QQ
微信登录
1
2
/ 2 页
下一页
返回列表
首页
›
业界区
›
业界
›
为什么RAG技术可以缓解大模型知识固化和幻觉问题 ...
为什么RAG技术可以缓解大模型知识固化和幻觉问题
[ 复制链接 ]
嗳诿
2025-10-13 17:40:02
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
1、大模型知识固化和幻觉问题
要理解大模型的时效性问题,需首先明确其技术原理:大模型通过输入文本与已固化在神经网络中的知识进行匹配,预测并输出概率最大的文本内容作为答案。其固化知识的神经网络形成于前期训练阶段,训练输入源自人类现有知识数据(包括互联网及线下知识数据)。模型一旦训练完成,其知识范围便被固定,回答能力完全取决于训练时的数据内容。
幻觉产生的原因是:无论匹配概率多低,模型总会生成输出,这种缺乏依据的输出如同人类空想,即形成幻觉。
如图所示:若大模型A基于2024年12月31日前的数据训练,当询问"2025年发生了哪些地震"时,它无法提供真实信息,强行回答则会虚构内容,因其神经网络中并无2025年数据。
因此,大语言模型面临两大核心问题:
1.知识固化:模型仅能回答训练数据范围内的内容,对训练后发生的事件(如2025年新发生的世界信息)或未参与训练的私有数据(如公司内部信息),统称为"外部知识"的内容,均无法直接回答。
2.幻觉与不可溯源:由于模型输出本质是对固化知识的重组,用户难以验证信息来源,导致不敢轻易相信。
2、RAG技术出现之前的解决方案
在RAG技术出现前,解决知识固化的主流方式是通过补充外部知识对模型进行持续微调,即利用新数据训练生成新模型(如下图所示)。
但该方案效率低,成本高,主要原因包括:
1.需庞大训练数据支撑
2.模型训练需要高昂GPU计算资源
3.模型训练技术门槛要求高
4.训练周期长,且效果不稳定
5.模型更新繁琐:如上图,即使在2025年8月9日好不容易完成了大模型B、C的迭代,仍无法覆盖2025年8月9日后的新知识。
3、RAG技术解决知识固化和幻觉问题的原理
RAG是英文(Retrieval-Augmented Generation,检索增强生成)的缩写,是由 Meta AI(原Facebook AI) 的研究团队于2020年首次提出,核心论文《Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks》(Patrick Lewis等)发表于2021年4月,论文地址:https://arxiv.org/pdf/2005.11401。
RAG的核心思想是不将新出现的知识内容用于大模型的训练,而是将最新的的问题相关的知识和要问的问题一起送给大模型,利用大模型语言组织能力,形成自然语言形式的答案。
RAG的核心思想是:不将新知识纳入模型训练,而是将实时问题与相关外部知识同步一起输入给模型,利用大模型的语言组织能力生成答案。如下图所示:
第①步:为实时信息/本地数据建立向量索引库。关于向量和向量数据库,请参考:https://www.cnblogs.com/twosedar/p/18957931
第②步:用户提问后,将问题向量化;
第③步:通过向量匹配,在第①步中建立的索引库中检索出最相关的条目
第④步:整合问题与检索结果生成提示词,输入给大模型
例如:“2025年发生了哪些地震?请参考如下信息回答:①2025.1.7西藏定日地震,②2025.7.30堪察加地震,回答时需标注参考条目序号"”
第⑤步:将大模型回复结果转述给用户
例如:“2025年发生了两次地震,包括1月7日定日地震,7月30日勘察加地震。参考条目① ②”
RAG巧妙的通过本地信息搜索和大模型集合的流程解决了知识固化问题,同时又避免了模型训练的高成本。而且通过展示参考条目,用户可验证信息来源,有效缓解幻觉问题。
4、那么问题来了,既然能够提前检索到信息,还用大模型做什么?
首先,传统检索只能返回相关段落或者片段,但是大模型却可以生成人性化的自然语言描述的答案。另外,大模型还能基于已有的基础知识进行信息的组织,甚至跨文档推理。如果没有大模型,信息检索就和传统搜索引擎的效果差不多了。
来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
为什么
RAG
技术
可以
缓解
相关帖子
从零实现一个生产级 RAG 语义搜索系统:C++ + ONNX + FAISS 实战
从零实现一个生产级 RAG 语义搜索系统:C++ + ONNX + FAISS 实战
从零实现一个生产级 RAG 语义搜索系统:C++ + ONNX + FAISS 实战
从零实现一个生产级 RAG 语义搜索系统:C++ + ONNX + FAISS 实战
RAG 时代的“破壁人”:为什么你的大模型应用急需 Docling?
为什么 SVG 能在现代前端中胜出?
为什么现代 C++ 库都用 PIMPL?一场关于封装、依赖与安全的演进
为什么在代理服务器上测试, http2 的转发性能比 http 1 更低?
FPGA使用镜像加载技术来切换运行中的比特流文件
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
照妖镜
相关推荐
业界
从零实现一个生产级 RAG 语义搜索系统:C++ + ONNX + FAISS 实战
1
13
明思义
2026-02-12
业界
从零实现一个生产级 RAG 语义搜索系统:C++ + ONNX + FAISS 实战
2
31
聚怪闩
2026-02-12
业界
从零实现一个生产级 RAG 语义搜索系统:C++ + ONNX + FAISS 实战
4
32
颜才
2026-02-12
业界
从零实现一个生产级 RAG 语义搜索系统:C++ + ONNX + FAISS 实战
0
36
湛恶
2026-02-12
业界
RAG 时代的“破壁人”:为什么你的大模型应用急需 Docling?
0
287
获弃
2026-02-13
安全
为什么 SVG 能在现代前端中胜出?
0
385
跟尴
2026-02-14
业界
为什么现代 C++ 库都用 PIMPL?一场关于封装、依赖与安全的演进
0
372
呵烘稿
2026-02-14
业界
为什么在代理服务器上测试, http2 的转发性能比 http 1 更低?
0
371
釉她
2026-02-15
安全
FPGA使用镜像加载技术来切换运行中的比特流文件
1
365
事值
2026-02-19
回复
(27)
锺冰洁
2025-10-15 12:18:45
回复
使用道具
举报
照妖镜
程序园永久vip申请,500美金$,无限下载程序园所有程序/软件/数据/等
yyds。多谢分享
战匈琼
2025-11-27 16:51:55
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
东西不错很实用谢谢分享
户烫擞
2025-12-11 05:30:53
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
感谢,下载保存了
泻缥
2025-12-20 10:30:50
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
分享、互助 让互联网精神温暖你我
背竽
2025-12-24 13:57:11
回复
使用道具
举报
照妖镜
程序园永久vip申请,500美金$,无限下载程序园所有程序/软件/数据/等
前排留名,哈哈哈
倘伟
2026-1-3 06:27:04
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
很好很强大 我过来先占个楼 待编辑
红弘丽
2026-1-9 01:31:37
回复
使用道具
举报
照妖镜
程序园永久vip申请,500美金$,无限下载程序园所有程序/软件/数据/等
感谢分享,下载保存了,貌似很强大
东郭欣然
2026-1-14 11:59:12
回复
使用道具
举报
照妖镜
程序园永久vip申请,500美金$,无限下载程序园所有程序/软件/数据/等
感谢,下载保存了
鲫疹
2026-1-19 01:39:02
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
鼓励转贴优秀软件安全工具和文档!
拙因
2026-1-19 09:07:48
回复
使用道具
举报
照妖镜
程序园永久vip申请,500美金$,无限下载程序园所有程序/软件/数据/等
不错,里面软件多更新就更好了
龙正平
2026-1-22 13:40:40
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
感谢发布原创作品,程序园因你更精彩
豹筒生
2026-1-23 07:02:32
回复
使用道具
举报
照妖镜
程序园永久vip申请,500美金$,无限下载程序园所有程序/软件/数据/等
感谢发布原创作品,程序园因你更精彩
峰襞副
2026-1-27 06:30:53
回复
使用道具
举报
照妖镜
程序园永久vip申请,500美金$,无限下载程序园所有程序/软件/数据/等
懂技术并乐意极积无私分享的人越来越少。珍惜
古修蟑
2026-1-28 09:02:29
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
新版吗?好像是停更了吧。
佟棠华
2026-1-30 07:14:09
回复
使用道具
举报
照妖镜
程序园永久vip申请,500美金$,无限下载程序园所有程序/软件/数据/等
很好很强大 我过来先占个楼 待编辑
准挝
2026-2-3 02:41:38
回复
使用道具
举报
照妖镜
程序园永久vip申请,500美金$,无限下载程序园所有程序/软件/数据/等
谢谢楼主提供!
苗嘉惠
2026-2-6 10:37:24
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
谢谢楼主提供!
普料飕
2026-2-6 10:58:13
回复
使用道具
举报
照妖镜
程序园永久vip申请,500美金$,无限下载程序园所有程序/软件/数据/等
yyds。多谢分享
僚娥
2026-2-6 11:44:55
回复
使用道具
举报
照妖镜
程序园永久vip申请,500美金$,无限下载程序园所有程序/软件/数据/等
感谢分享
下一页 »
1
2
/ 2 页
下一页
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
回复
本版积分规则
回帖并转播
回帖后跳转到最后一页
签约作者
程序园优秀签约作者
发帖
嗳诿
2026-2-6 11:44:55
关注
0
粉丝关注
22
主题发布
板块介绍填写区域,请于后台编辑
财富榜{圆}
3934307807
991124
anyue1937
9994892
kk14977
6845359
4
xiangqian
638210
5
宋子
9898
6
韶又彤
9918
7
闰咄阅
9993
8
刎唇
9995
9
蓬森莉
9883
10
遗憩
10006
查看更多
今日好文热榜
317
OpenClaw多Agent协作踩坑实录:从翻车到跑
712
【节点】[MainLightShadow节点]原理解析与
630
模拟退火算法
899
Claude Code 的 Skills 可以在 Trae IDE 中
254
付费 AI 用户和免费用户之间,究竟差了什么
699
手把手教你使用vscode开发stm32!
1003
“老东西,你懦弱了”——关于Vibe Coding
926
告别Hyprland/Niri键鼠共享难题:Pynergy
752
解惑|公司员工健身房需要哪些器材?上海皓
518
凸优化数学基础笔记(六):凸集、凸函数与
389
SeeDance2.0提示词之跳舞女孩
11
SeeDance2.0提示词之跳舞女孩
683
国内零门槛首个免费 开源 7×24小时帮
572
[拆解LangChain执行引擎]非常规Pending Wri
69
AI开发-python-milvus向量数据库(2-8 -mil
80
[LKD/Linux 内核] 关于对 current_thread_i
9
[LKD/Linux 内核] 关于对 current_thread_i
7
[LKD/Linux 内核] 关于对 current_thread_i
7
9、PipedInputStream和PipedOutputStream的