Oracle AI：使用SQL来实现融合检索和整个RAG流程

缢闸 · 2025-12-1 08:10:00

RAG 都不用写程序了吗？
是的，Oracle 总是习惯把简单留给用户，目前已支持通过一条 SQL 就能实现基础的 RAG 需求。
本文就来深入剖析下这样的一条SQL，并展现下输出效果。
01｜实现逻辑

这里先引用最近 AI 大会上的一张图，非常清晰地展现了实现逻辑：

从图片中可以看到，真的是就用这么一条SQL完成了RAG的整个流程。
02｜技术拆解

虽然对于暴露给用户只有这么一条SQL，但实际上这条SQL里面调用了很多库内的函数，用户自然可以不关注，但作为技术从业者还是需要理解一下的。
① 用户问题向量化

将用户输入的问题向量化，这里直接调用 vector_embedding() 函数。
Embedding模型可以直接使用已经导入Oracle库内的onnx格式模型，比如我这里使用的是 BGE_BASE，SQL 就类似这样：

select vector_embedding(BGE_BASE USING :question_text AS DATA)

复制代码

② 执行向量搜索

vector_distance() 函数
查询对应的库内文本信息，依据库内文本信息的向量和用户问题的向量比较结果，选TOP N的记录出来。
实践动手时就会发现，图中有个细节是不对的，估计是工作人员的笔误。
具体在 vector_distance() 函数里面多写了 SELECT，实际应该去掉，正确SQL类似如下:

select content from t_history
order by vector_distance(v, vector_embedding(BGE_BASE USING :question_text AS DATA))
FETCH APPROX FIRST 5 ROWS ONLY

复制代码

注：

笔者这里是Oracle 23.7的测试环境，以笔者这个版本的实际测试的结果为准
本文所有测试都改成笔者实际测试使用的一张表t_history

③ 组合LLM提示词

将自定义的提示词 + 用户的问题 + TOP N的记录作为上下文组合成整体的LLM提示词。

WITH TOP5 AS (select content from t_history where type = 'English'
order by vector_distance(v, vector_embedding(BGE_BASE USING :question_text AS DATA))
FETCH APPROX FIRST 5 ROWS ONLY),
LLM_PROMPT AS (
SELECT (
'Answer this question using the following context,' || CHR(10) || CHR(10) ||
'QUESTION: ' || :question_text || CHR(10) || CHR(10) ||
'CONTEXT: ' || CHR(10) || CHR(10) ||
LISTAGG(content, CHR(10))
) AS prompt_text
FROM TOP5
)

复制代码

注：

这里使用 || 巧妙的拼接了所有需要的内容
使用 LISTAGG(content, CHR(10)) 函数将多行 content 数据合并成单个字符串
谓词条件 type = 'English' 代表只关注 t_history 表中这个类型相关的内容

④ 获得LLM回复结果

最终调用 dbms_vector_chain.utl_to_generate_text() 获取LLM的最终回答。
理想情况下，只需要在上一步的SQL基础上，再加一段：

select dbms_vector_chain.utl_to_generate_text(prompt_text, json(:LLM_paras)) as answer
from LLM_PROMPT;

复制代码

不过研究发现，这里的 dbms_vector_chain 是一个包，utl_to_generate_text 是包中的一个函数，遗憾的是目前还不能支持国内模型API直接调用。
03｜照猫画虎

理解了上面的技术，我们只需要解决一个国内模型API的调用问题，就可以解决很多国内的RAG需求了。
所以这里先尝试自定义一个函数来实现：CHAT_LLM()，功能很简单就是实现调用deepseek官方的api来交互。
下面我们就模拟一个用户需求：
首先，用户已经通过系统记录了日常工作、学习内容；
现在要求实现以下需求：

支持用户输入自然语言描述问题
我们根据问题向量检索到最相关的前5条记录内容，并支持过滤指定分类
程序自动构造组合的提示词
用最终的提示词请求LLM获取最终结果

本质还是直接模仿开头的那张片子来具体实现，只需要：
最终SQL如下：

WITH TOP5 AS (select content from t_history where type = 'English'
order by vector_distance(v, vector_embedding(BGE_BASE USING :question_text AS DATA))
FETCH APPROX FIRST 5 ROWS ONLY),
LLM_PROMPT AS (
SELECT (
'Answer this question using the following context,' || CHR(10) || CHR(10) ||
'QUESTION: ' || :question_text || CHR(10) || CHR(10) ||
'CONTEXT: ' || CHR(10) || CHR(10) ||
LISTAGG(content, CHR(10))
) AS prompt_text
FROM TOP5
)select CHAT_LLM(prompt_text) as Answer from LLM_PROMPT;

复制代码

可以先在SQL命令行下测试效果：

-- 首先定义变量
VARIABLE question_text VARCHAR2(100);
-- 给变量赋值
BEGIN
:question_text := '总结有关日常对话的英文对话';
END;
/
-- 完整的显示配置（新增SET ESCAPE OFF）
SET ESCAPE OFF
SET LINESIZE 32767
SET PAGESIZE 0

复制代码

04｜最终效果

因为TOP5格式还有点显示问题在调试ing，所以这里先用TOP1的内容输出效果展示下：

实话讲思路虽然很简单，但是自定义的函数对模型返回的格式处理还是相当头疼，即便有AI辅助也是被折腾的焦头烂额。
关于自定义的CHAT_LLM函数内容本文就先不贴了，因为调试过程中发现功能实现简单，但是细节处理还是需要太多考量的，建议等官方函数支持国内LLM，或者未来测试相对稳定了笔者再跟大家分享后续吧。

来源：程序园用户自行投稿发布，如果侵权，请联系站长删除
免责声明：如果侵犯了您的权益，请联系站长，我们会及时删除侵权内容，谢谢合作！

龙玮奇 · 2025-12-13 06:41:23

感谢，下载保存了

岑韬哎 · 2025-12-13 17:28:39

前排留名，哈哈哈

吮槌圯 · 2026-1-18 07:55:11

感谢分享，下载保存了，貌似很强大

些耨努 · 2026-1-18 08:22:06

前排留名，哈哈哈

郁梓馨 · 2026-1-20 20:45:48

感谢，下载保存了

劳暄美 · 2026-1-23 01:30:13

感谢发布原创作品，程序园因你更精彩

郗新语 · 2026-1-23 08:04:23

谢谢分享，试用一下

劳怡月 · 2026-1-24 04:22:56

前排留名，哈哈哈

里豳朝 · 2026-1-26 04:45:58

热心回复！

郏琼芳 · 2026-2-1 03:09:54

感谢分享，下载保存了，貌似很强大

睁扼妤 · 2026-2-2 04:33:40

用心讨论，共获提升！

呼延冰枫 · 2026-2-2 04:49:25

新版吗？好像是停更了吧。

姊囝 · 2026-2-4 07:54:10

热心回复！

倡遍竽 · 2026-2-6 10:37:25

新版吗？好像是停更了吧。

拙因 · 2026-2-7 09:22:39

yyds。多谢分享

啖曼烟 · 2026-2-7 09:29:01

东西不错很实用谢谢分享

济曝喊 · 2026-2-8 02:13:13

前排留名，哈哈哈

皇甫佳文 · 2026-2-8 02:14:27

感谢，下载保存了

掳诚 · 2026-2-9 01:01:09

不错，里面软件多更新就更好了

账号		自动登录	找回密码
密码			立即注册

Oracle AI：使用SQL来实现融合检索和整个RAG流程

相关帖子

回复

签约作者

Oracle AI：使用SQL来实现融合检索和整个RAG流程

相关帖子

相关推荐

回复

签约作者