登录
/
注册
首页
论坛
其它
首页
科技
业界
安全
程序
广播
Follow
关于
每日签到
每天签到奖励2圆-6圆
发帖说明
VIP申请
登录
/
注册
账号
自动登录
找回密码
密码
登录
立即注册
搜索
搜索
关闭
CSDN热搜
程序园
精品问答
技术交流
资源下载
本版
帖子
用户
软件
问答
教程
代码
写记录
写博客
VIP申请
VIP网盘
网盘
联系我们
每日签到
道具
勋章
任务
设置
我的收藏
退出
腾讯QQ
微信登录
返回列表
首页
›
业界区
›
安全
›
RAG系统
RAG系统
[ 复制链接 ]
鞠古香
2025-5-31 23:39:01
在数据准备阶段,系统对多种格式(如PDF、TXT)的文档进行多模解析,转换为统一的文本对象,同时附加元数据(如标题、创建时间),以便于检索和过滤。接着,系统构建正向和倒排索引,为检索提供高效的数据支持。
检索过程分为两个阶段。第一阶段采用BM25算法,利用倒排索引基于词频(TF)和逆文档频率(IDF)快速匹配包含查询关键词的候选文档,初步筛选出相关内容。第二阶段通过BGE-M3模型将查询和候选文档转化为768维嵌入向量,利用FAISS索引执行最近邻搜索,通过余弦相似度计算进行语义排序,进一步提升文档的相关性。
随后,系统使用bge-reranker-v2-m3模型对检索结果进行重排序。该模型将查询与每个候选文档拼接后输入Transformer,重新计算更精确的相似度分数,解决嵌入模型可能因信息压缩导致的精度损失,最终筛选出Top-K最相关文档。
最后,Qwen2模型以重排序后的Top-K文档为上下文,结合用户原始查询生成最终答案并输出给用户。
来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
RAG
系统
相关帖子
基于RAG的工业品商品智能推荐
分布式系统-秒杀
多cms养站系统【AI原创】
边缘端本地知识库构建与 RAG 优化实践
高压直流系统及相关电气件
软考高级“系统架构设计师”学习笔记
Linux系统编程入门(下)
软考高级“系统架构设计师”论文——论微服务架构及其应用
LLM-RAG项目细节-数据处理、分块..
推荐系统中神经网络超参数调优—经验顺序方法
vip免费申请,1年只需15美金$
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
照妖镜
相关推荐
安全
基于RAG的工业品商品智能推荐
0
416
祖娅曦
2025-09-01
业界
分布式系统-秒杀
0
616
辅箱肇
2025-09-01
软件
多cms养站系统【AI原创】
0
57
新程序
2025-09-02
安全
边缘端本地知识库构建与 RAG 优化实践
0
858
訾颀秀
2025-09-02
安全
高压直流系统及相关电气件
0
386
恿深疏
2025-09-06
安全
软考高级“系统架构设计师”学习笔记
0
454
渭茱瀑
2025-09-07
业界
Linux系统编程入门(下)
0
784
卜笑
2025-09-07
安全
软考高级“系统架构设计师”论文——论微服务架构及其应用
0
941
乱蚣
2025-09-08
业界
LLM-RAG项目细节-数据处理、分块..
0
174
煅圆吧
2025-09-09
安全
推荐系统中神经网络超参数调优—经验顺序方法
0
72
港髁
2025-09-10
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
回复
本版积分规则
回帖并转播
回帖后跳转到最后一页
浏览过的版块
业界
签约作者
程序园优秀签约作者
发帖
鞠古香
2025-5-31 23:39:01
关注
0
粉丝关注
25
主题发布
板块介绍填写区域,请于后台编辑
财富榜{圆}
敖可
9984
杭环
9988
凶契帽
9988
4
氛疵
9988
5
黎瑞芝
9988
6
猷咎
9986
7
里豳朝
9986
8
肿圬后
9986
9
蝓俟佐
9984
10
虽裘侪
9984
查看更多