登录
/
注册
首页
论坛
其它
首页
科技
业界
安全
程序
广播
Follow
关于
导读
排行榜
资讯
发帖说明
登录
/
注册
账号
自动登录
找回密码
密码
登录
立即注册
搜索
搜索
关闭
CSDN热搜
程序园
精品问答
技术交流
资源下载
本版
帖子
用户
软件
问答
教程
代码
写记录
写博客
小组
VIP申请
VIP网盘
网盘
联系我们
发帖说明
道具
勋章
任务
淘帖
动态
分享
留言板
导读
设置
我的收藏
退出
腾讯QQ
微信登录
返回列表
首页
›
业界区
›
业界
›
别再把 RAG 当搜索:它本质上是在重构 Context ...
别再把 RAG 当搜索:它本质上是在重构 Context
[ 复制链接 ]
陆菊
昨天 10:15
程序园永久vip申请,500美金$,无限下载程序园所有程序/软件/数据/等
我们可能听过很多对 RAG 的描述:
“给 AI 接个知识库,它就能查资料了”;
“加上 RAG,模型就不会胡说八道”;
“RAG 就是让模型学会联网搜索”。
这些说法有一点道理,但都不够准确。
因为从系统机制上看,大语言模型本身并不会“查资料”。
它不会主动访问数据库,
不会自己执行检索,
更不会在推理时更新参数。
它始终只做一件事:
根据当前输入,预测下一个最可能的 token。
所以,RAG 的真正本质不是“给模型新增能力”,而是:
在推理前重构输入信息,让模型在更高质量的上下文里做同一件事。
一、为什么 RAG 必然出现:模型知识天然“冻结”
大模型在部署后会遇到三类结构性问题。
1)知识是静态的
训练结束后,参数基本冻结。模型天然不知道训练截止之后的新信息:
最新政策与新闻;
实时业务数据;
企业内部文档。
2)知识是不可控的
预训练语料来源广、质量不一,模型内部知识往往:
难以追溯来源;
混杂噪声;
难以满足企业“可信回答”的要求。
3)知识是高成本更新的
靠再训练或微调去追实时知识,成本高、周期长、运维复杂,不适合作为日常更新路径。
结论:问题不在“模型不会说”,而在“模型看不见我们要它依据的信息”。
对我们有什么用?
当我们发现回答过时、来源不稳、不可审计时,优先考虑知识接入与检索架构,而不是第一反应换更大模型。
二、RAG 真正在做什么:把“检索结果”变成“可见上下文”
RAG(Retrieval-Augmented Generation)可以拆成两部分:
Retrieval:外部系统检索信息;
Generation:模型基于新输入生成答案。
关键点在于:
查资料的是系统,生成文本的是模型。
典型流程如下:
用户提出问题;
检索系统在知识库中召回相关片段;
系统把“问题 + 证据片段 + 约束提示”拼成新输入;
模型基于这个输入完成生成。
在整个过程中,模型并没有“访问数据库”这个动作。
它只是看到了更多、更相关的信息。
对我们有什么用?
我们可以把 RAG 理解成“给模型喂对材料”,而不是“教模型新技能”。这样设计目标会更清晰:先解决可见性,再谈生成质量。
三、RAG 的能力来源:信息可见性,不是推理能力本体
RAG 上线后效果变好,通常来自三件事:
信息更新了(不再只靠旧参数);
信息相关了(不再靠模型猜);
信息可控了(能限制来源与范围)。
这会直接带来:
准确率提升;
幻觉率下降;
回答可追溯。
但要明确:
RAG 增强的是“知道什么”,不是“如何思考”的上限。
如果任务本身需要复杂逻辑规划或多步工具执行,仅靠 RAG 不够。
对我们有什么用?
当问题是“事实依据不足”,用 RAG;
当问题是“逻辑链太复杂”,要补推理流程、工具调用或任务分解。
四、为什么很多 RAG 做不出效果:问题常出在检索链路
很多团队以为“接了向量库 = 做了 RAG”。
现实里,效果往往败在检索工程细节上。
1)切块(Chunking)
不切块或切块粗糙,会导致:
语义被稀释;
召回粒度过粗;
有效信息被无关文本淹没。
2)召回(Recall)
只用单一路径召回,容易漏关键证据。常见需要混合策略:
向量召回(语义相似);
关键词/BM25(字面精确);
元数据过滤(时间、权限、业务域)。
3)重排(Rerank)
TopK 召回不等于最终相关。没有重排,模型可能拿到“看着相关但并不回答问题”的片段。
4)上下文编排(Context Assembly)
把证据如何组织进 prompt(顺序、去重、压缩、引用格式)会直接影响最终答案质量。
RAG 不是一个点功能,而是一条从数据到上下文的完整生产线。
对我们有什么用?
如果“明明有资料却答不好”,先查检索链路指标(召回率、命中率、重排质量),不要急着调温度参数。
五、RAG 最大价值:让回答“有出处、可治理、可迭代”
相比只靠模型参数,RAG 的核心业务价值在于治理能力。
1)可追溯
回答可以绑定来源文档与片段,便于审计与复核。
2)可更新
更新知识库即可生效,无需重训模型。
3)可定制
可以按企业、部门、角色接入不同知识域和权限规则。
这对企业场景尤其关键:
我们不只需要“会回答”,还需要“回答可负责”。
六、RAG 的边界:它不是万能增强器
RAG 解决不了所有问题,常见边界包括:
检索不到:知识库缺失或索引质量差;
检索到了但没用好:上下文拼装失败;
任务本身超出模型推理上限:需要工作流与工具链。
因此,成熟架构通常是:
RAG 负责事实可见性;
工作流负责任务编排;
Agent/工具调用负责行动闭环;
评测体系负责质量保障。
结语
RAG 最重要的启示不是“模型更聪明了”,而是:
AI 能力的上限,首先取决于它在生成那一刻能看到什么信息。
所以,与其把 RAG 理解成“让 AI 去查资料”,
不如把它理解成一次系统范式升级:
从“依赖模型记忆”,转向“动态重构输入”。
看清这一点,我们就能把 RAG 从一个功能名词,变成可持续优化的能力体系。
来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
再把
RAG
搜索
本质上
是在
相关帖子
韩国国民搜索 NAVER:使用 JuiceFS 打通 Hadoop 与 Kubernetes 存储实践
从零实现一个生产级 RAG 语义搜索系统:C++ + ONNX + FAISS 实战
从零实现一个生产级 RAG 语义搜索系统:C++ + ONNX + FAISS 实战
从零实现一个生产级 RAG 语义搜索系统:C++ + ONNX + FAISS 实战
从零实现一个生产级 RAG 语义搜索系统:C++ + ONNX + FAISS 实战
RAG 时代的“破壁人”:为什么你的大模型应用急需 Docling?
HTML5 自定义属性 data-*:别再把数据塞进 class 里了!
浅入了解OceanBase混合搜索
当 AI 开始"翻书":一文读懂检索增强生成(RAG)的前世今生与实战指南
7 道 RAG 基础概念知识点/面试题总结
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
照妖镜
相关推荐
业界
韩国国民搜索 NAVER:使用 JuiceFS 打通 Hadoop 与 Kubernetes 存储实践
1
10
迭婵椟
2026-02-12
业界
从零实现一个生产级 RAG 语义搜索系统:C++ + ONNX + FAISS 实战
7
34
明思义
2026-02-12
业界
从零实现一个生产级 RAG 语义搜索系统:C++ + ONNX + FAISS 实战
7
56
聚怪闩
2026-02-12
业界
从零实现一个生产级 RAG 语义搜索系统:C++ + ONNX + FAISS 实战
9
60
颜才
2026-02-12
业界
从零实现一个生产级 RAG 语义搜索系统:C++ + ONNX + FAISS 实战
5
67
湛恶
2026-02-12
业界
RAG 时代的“破壁人”:为什么你的大模型应用急需 Docling?
5
368
获弃
2026-02-13
安全
HTML5 自定义属性 data-*:别再把数据塞进 class 里了!
0
101
啤愿
2026-02-24
安全
浅入了解OceanBase混合搜索
0
669
泥地锚
2026-02-24
安全
当 AI 开始"翻书":一文读懂检索增强生成(RAG)的前世今生与实战指南
0
14
蔬陶
2026-02-28
业界
7 道 RAG 基础概念知识点/面试题总结
0
782
碛物
2026-03-02
回复
(1)
涅牵
昨天 11:44
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
yyds。多谢分享
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
回复
本版积分规则
回帖并转播
回帖后跳转到最后一页
签约作者
程序园优秀签约作者
发帖
陆菊
昨天 11:44
关注
0
粉丝关注
27
主题发布
板块介绍填写区域,请于后台编辑
财富榜{圆}
3934307807
991125
anyue1937
9994892
kk14977
6845359
4
xiangqian
638210
5
宋子
9888
6
韶又彤
9910
7
闰咄阅
9993
8
刎唇
9995
9
蓬森莉
9873
10
遗憩
10006
查看更多
今日好文热榜
556
虚拟线程深度解析:轻量并发编程的未来趋势
772
程序员必读的AI Prompt最佳实践
981
为什么我拖了一个多月才开始使用OpenClaw?
407
【节点】[FresnelEquation节点]原理解析与
929
ManimCE v0.20.1 发布:LaTeX 渲染修复与动
274
安心存取,轻松分享!一款基于 CloudFlare
490
收藏! 2026最强开源AI编程工具清单:从代码
975
非统一内存访问架构NUMA的是是非非
324
C#/.NET/.NET Core技术前沿周刊 | 第 67 期
378
Oracle数据库被勒索加密一键open工具–OraF
233
嵌入式通用通信帧协议设计
575
打破同源枷锁:深入理解 postMessage 跨域
5
NVIDIA GPU 集合通信库 NCCL 基本概念简述
463
凸优化数学基础笔记(九):最优化问题的要
650
深入浅出:RS-232 和 RS-485 串口通信的区
940
高光谱成像(一)高光谱图像
542
3分钟搞懂深度学习AI:毁掉AI的广播机制陷
245
AI Agent框架探秘:拆解 OpenHands(10)--
427
数据库服务存储引擎
562
当测试自动化率达到80%,测试工程师还剩下