登录
/
注册
首页
论坛
其它
首页
科技
业界
安全
程序
广播
Follow
关于
导读
排行榜
资讯
发帖说明
登录
/
注册
账号
自动登录
找回密码
密码
登录
立即注册
搜索
搜索
关闭
CSDN热搜
程序园
精品问答
技术交流
资源下载
本版
帖子
用户
软件
问答
教程
代码
写记录
写博客
小组
VIP申请
VIP网盘
网盘
联系我们
发帖说明
道具
勋章
任务
淘帖
动态
分享
留言板
导读
设置
我的收藏
退出
腾讯QQ
微信登录
返回列表
首页
›
业界区
›
业界
›
从 OpenAI 兼容到 Anthropic 崛起:大模型“交错思考” ...
从 OpenAI 兼容到 Anthropic 崛起:大模型“交错思考”协议的演进与变局
[ 复制链接 ]
上官银柳
2026-1-14 02:30:01
程序园永久vip申请,无限下载程序园所有程序/软件/数据/等
曾几何时,大模型开发者的世界是单纯而美好的。无论是 OpenAI、Claude,还是后来的 DeepSeek、Moonshot等,大家都在讲同一种语言——
OpenAI Chat Completions API
。
那时候,我们只需要换一下 base_url 和 api_key,把之前的聊天历史(User/Assistant/Tool消息)一股脑传进去,就能无缝切换模型。工具调用(Function Calling)虽然各家微有差异,但本质逻辑也是通用的。
然而,随着“推理模型”(Reasoning Models)的爆发,这座巴别塔开始摇摇欲坠。特别是当我们需要让 Agent 进行
多步工具调用(Multi-turn Tool Use)
时,一个核心问题浮出水面:
模型之前的“思考过程”,到底要不要传回去?如果传,怎么传?
这就是各大厂商正在混战的焦点——
交错思考(Interleaved Thinking)
。
为什么我们需要“交错思考”?
在 DeepSeek R1 刚出来的时候,官方文档有一句不起眼的建议:
“在多轮对话中,建议舍弃 reasoning_content(思维链内容)。”
https://api-docs.deepseek.com/zh-cn/guides/thinking_mode
对于简单的问答,这没问题。但对于 Agent 来说,这是致命的。这里有两个核心理由,一个是显而易见的
“智商”
问题,另一个则是反直觉的
“成本”
问题。
1. 拒绝“失忆”:让模型记住决策路径
试想一个复杂的编程任务,模型在第一步通过思维链(CoT)决定了代码架构,并调用了 read_file 工具。如果我们在第二轮对话中把这个思维链丢弃了,模型就像“失忆”了一样,它只看到了自己发出的 read_file 命令,却忘记了
“为什么要这么做”
以及
“原本计划下一步做什么”
。结果就是模型被迫重新推理,甚至做出与上一步逻辑相悖的决策。
2. 意想不到的经济账:Prompt Cache 的魔法
很多人直觉上认为:回传思维链会增加 Input Token 的数量,肯定更贵、更慢。
大错特错。
在支持 Prompt Cache(提示词缓存)的计费体系下(如 DeepSeek、Anthropic 等),缓存命中的 Token 价格通常仅为未命中的 1/10 甚至更低。
思维链(Reasoning)通常位于工具调用(Tool Call)的
前面
。如果我们完整回传“User -> Reasoning -> Tool Call”,这整个序列作为“上文前缀”,极易触发 Prompt Cache 命中。
这意味着:
回传思维链,虽然 Token 变多了,但因为缓存命中率大幅提升,实际推理速度反而更快,综合成本反而更低!
反之,如果你为了省 Token 删掉了思维链,模型可能因为上下文断裂而不得不输出更多的 Output Token 来“找补”逻辑,那才是真正的昂贵。
混乱的演进史:各家厂商的“补丁”与“创新”
为了实现这一目标,各大厂商的 API 协议分裂成了“战国七雄”。回顾 2025 年,我们可以清晰地看到这场协议演进的时间线。
1. Anthropic 的“降维打击”:Messages API 的原生引领
当整个行业还在摸索如何处理推理模型的思维链时,Anthropic 在
2025 年 2 月
发布的
Claude 3.7 Sonnet
中,率先展示了什么是“原生支持”的交错思考。
在 Anthropic 的 Messages API 中,思维链不再是附属品,而是 extended thinking 协议的核心。它
强制要求
回传思维链,并且引入了 signature 字段进行防篡改签名。
这种设计非常清晰、严谨。以至于后来的 MiniMax 和 DeepSeek V3.2 甚至在其官方文档中宣布支持 Anthropic Messages API 格式。这从侧面证明了该协议在设计上的优越性——它是目前做 Agent 对话和多步工具调用体验最好的协议,简单、纯粹,是名副其实的先驱。
2. OpenAI 与 Google:封闭与曲高和寡的跟随
面对 Anthropic 的先发优势,老牌霸主们的反应显得有些迟缓和复杂。
OpenAI 直到
2025 年 3 月
才推出
Responses API
,允许通过 include: reasoning.encrypted_content 回传加密的思维链。这种协议结构复杂,与原有的 Chat Completions 差异巨大,导致生态响应寥寥。
Google Gemini 则在
2025 年 11 月
走向了另一条路。它坚定地支持了思维链回传,但它非常“高冷”——这一功能仅在 Gemini 原生 API 中提供。如果你使用的是 Google 提供的 OpenAI 兼容接口,抱歉,不支持补丁,无法回传。这种“曲高和寡”的策略,使得想用一套代码兼容所有模型的开发者必须单独为 Gemini 写一套适配逻辑。
3. MiniMax M2:从标签视觉到协议补丁
到了 2025 年下半年,国产厂商开始尝试用更直接的方式解决问题。
2025 年 10 月
发布的
MiniMax M2
借鉴了 DeepSeek R1 早期的视觉标签概念,并将其强化为一种交错思考协议。它允许模型通过 标签输出思考过程,并要求用户在下一轮对话中将这些 内容按原样回传(Interleaved)。虽然也支持拆分字段,但其核心逻辑是在现有文本流中嵌入标签。这相当于给 Chat Completions API 打了一个“文本级”的补丁,虽然解决了问题,但处理字符串解析总是显得不够优雅。
4. DeepSeek V3.2 的突破:完美的 API 补丁
而在 2025 年年底,
DeepSeek V3.2
的出现为这场混战带来了新的曙光。
在
2025 年 12 月
的更新中,它没有破坏 Chat Completions API 的基本结构,而是允许在
输入端
(Messages 数组)中直接包含 reasoning_content 字段。
这是一个极其聪明的“协议级补丁”。输入和输出字段高度一致,对现有生态侵入性最小。我认为,
DeepSeek 的这种“增强版 Chat Completions”方案,是最有希望在未来重新统一 Chat API 江湖的路径之一
。
大模型“交错思考”演进时间线
为了更直观地看清这场混战,我整理了各大模型支持交错思考的关键时间点:
时间模型/事件协议/特征评价
2025.01
DeepSeek R1
输出 reasoning_content确立了思维链字段标准,引入 视觉概念,但当时未标准化回传机制。
2025.02
Claude 3.7
Messages API
(Extended Thinking)
SOTA 级设计
。必须回传,带签名防篡改。设计最优雅,被多家厂商兼容。
2025.03
OpenAI
Responses API支持回传加密思维链。协议太重,生态响应冷淡。
2025.10
MiniMax M2
标签包裹 / 原样回传要求回传 内容。虽有效,但解析标签增加了协议复杂度。
2025.11
Gemini 3.0 Pro
原生 API 支持
功能很强,但仅限原生 API。OpenAI 兼容接口不支持回传,导致集成成本极高(曲高和寡)。
2025.12
DeepSeek V3.2
增强版 Chat Completions
允许输入端包含 reasoning_content。
最具潜力的通用方案
,兼顾了兼容性与功能性。
2025.12
GitHub Copilot
v1.107 更新终于支持通过改造后的 Chat API 回传 reasoning content,体感大幅提升。
变局:开发者该何去何从?
我们现在正处在一个“变局”之中。
一方面,
Anthropic Messages API
凭借其优雅的设计,正在成为高端 Agent 开发的首选,甚至引发了其他厂商的兼容;另一方面,
DeepSeek V3.2
推出的“增强版 Chat Completions”方案,凭借对旧生态的极致兼容,极有可能成为事实上的工业标准。
而最尴尬的,反而是原本的霸主 OpenAI,以及不得不切回原生 SDK 的 Google Gemini。
作为开发者,我们不想陷入这种协议的泥潭。我们需要的是:
写一套代码,接入所有模型,并且都能拥有完美的“交错思考”体验,同时还能吃到 Prompt Cache 的红利。
这正是我开发
Sdcb Chats
的初衷。
在最新的
1.9.0 版本
中,我重点解决了这个问题:
统一网关
:无论底层是 OpenAI、DeepSeek 还是 Gemini,Sdcb Chats 都能帮你屏蔽差异。
拥抱先进协议
:全面支持
Anthropic Messages API
协议格式。你可以用 Claude 的原生体验来调用 DeepSeek V3.2 或 MiniMax,享受一致的思维链回传和防篡改机制。
自动适配
:对于支持“增强版 Chat Completions”的模型,网关会自动处理字段映射,你只需关注业务逻辑。
协议的战争可能还会持续很久,但你的代码不应该为此买单。
如果你也受够了写 if (model == "deepseek"),欢迎来试用 Sdcb Chats,让我们一起以不变应万变。
来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
OpenAI
兼容
Anthropic
崛起
大模型
相关帖子
Function Calling实战:让大模型学会调用外部工具
国产EPM崛起:2026年选型趋势分析
国产EPM崛起:2026年选型趋势分析
国产EPM崛起:2026年选型趋势分析
国产EPM崛起:2026年选型趋势分析
国产EPM崛起:2026年选型趋势分析
大模型之Linux服务器部署大模型
[深度学习] 大模型学习7-多模态大模型全景解析
Anthropic 翻车了:51万行代码泄露,AI 巨头的"底裤"被扒了个干净
Anthropic 翻车了:51万行代码泄露,AI 巨头的"底裤"被扒了个干净
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
照妖镜
相关推荐
安全
Function Calling实战:让大模型学会调用外部工具
0
555
鞠彗云
2026-03-29
业界
国产EPM崛起:2026年选型趋势分析
0
683
灼巾
2026-03-30
业界
国产EPM崛起:2026年选型趋势分析
0
201
梨恐
2026-03-30
业界
国产EPM崛起:2026年选型趋势分析
0
513
厥轧匠
2026-03-30
业界
国产EPM崛起:2026年选型趋势分析
0
703
缣移双
2026-03-30
业界
国产EPM崛起:2026年选型趋势分析
0
650
雌鲳签
2026-03-30
业界
大模型之Linux服务器部署大模型
0
165
轩辕娅童
2026-03-30
业界
[深度学习] 大模型学习7-多模态大模型全景解析
0
5
赖娅闺
2026-03-31
业界
Anthropic 翻车了:51万行代码泄露,AI 巨头的"底裤"被扒了个干净
0
997
阕阵闲
2026-04-01
业界
Anthropic 翻车了:51万行代码泄露,AI 巨头的"底裤"被扒了个干净
0
87
敕码
2026-04-01
回复
(12)
王妍芳
2026-1-30 02:32:08
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
新版吗?好像是停更了吧。
上官泰
2026-2-1 05:49:46
回复
使用道具
举报
照妖镜
程序园永久vip申请,无限下载程序园所有程序/软件/数据/等
谢谢分享,辛苦了
阎逼
2026-2-6 10:35:31
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
谢谢分享,试用一下
敞撬
2026-2-9 15:22:53
回复
使用道具
举报
照妖镜
程序园永久vip申请,无限下载程序园所有程序/软件/数据/等
感谢,下载保存了
倡粤
2026-2-10 08:08:47
回复
使用道具
举报
照妖镜
程序园永久vip申请,无限下载程序园所有程序/软件/数据/等
分享、互助 让互联网精神温暖你我
卜笑
2026-2-10 23:06:21
回复
使用道具
举报
照妖镜
程序园永久vip申请,无限下载程序园所有程序/软件/数据/等
感谢发布原创作品,程序园因你更精彩
讲怔
2026-2-11 14:40:00
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
喜欢鼓捣这些软件,现在用得少,谢谢分享!
俏挺喳
2026-2-21 07:05:35
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
收藏一下 不知道什么时候能用到
痕伯
2026-2-22 09:02:10
回复
使用道具
举报
照妖镜
程序园永久vip申请,无限下载程序园所有程序/软件/数据/等
不错,里面软件多更新就更好了
捡嫌
2026-2-24 06:18:04
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
很好很强大 我过来先占个楼 待编辑
稼布欤
2026-2-25 08:34:54
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
过来提前占个楼
嘀荼酴
2026-2-26 03:33:17
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
这个好,看起来很实用
岑韬哎
2026-3-8 09:56:43
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
感谢分享
赖琳芳
2026-3-9 07:57:18
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
不错,里面软件多更新就更好了
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
回复
本版积分规则
回帖并转播
回帖后跳转到最后一页
签约作者
程序园优秀签约作者
发帖
上官银柳
2026-3-9 07:57:18
关注
0
粉丝关注
23
主题发布
板块介绍填写区域,请于后台编辑
财富榜{圆}
3934307807
991125
anyue1937
9994892
kk14977
6845359
4
xiangqian
638210
5
神泱
9539
6
宋子
9880
7
韶又彤
9911
8
注思
9034
9
荪俗
9023
10
诀锺
9036
查看更多
今日好文热榜
645
【ESP32】ESP32 使用 MQTT 连接华为云 IoT
770
Axios遭供应链投毒攻击(附排查与紧急补救
931
AI 可以取代运维了吗?
83
测试人必备的4个AI Skills(附下载地址和详
74
记一次Webshell流量分析2 | 添柴不加火
453
记一次Webshell流量分析2 | 添柴不加火
139
记一次Webshell流量分析2 | 添柴不加火
727
记一次Webshell流量分析2 | 添柴不加火
68
记一次Webshell流量分析2 | 添柴不加火
412
AI元人文:在荆棘中开路——对四个实践性追
930
记一次Webshell流量分析2 | 添柴不加火
3
Python模块与包管理完全指南:从入门到精通
422
记一次Webshell流量分析2 | 添柴不加火
2
Python模块与包管理完全指南:从入门到精通
271
AI元人文:在荆棘中开路——对四个实践性追
577
记一次Webshell流量分析2 | 添柴不加火
86
记一次Webshell流量分析2 | 添柴不加火
160
记一次Webshell流量分析2 | 添柴不加火
876
记一次Webshell流量分析2 | 添柴不加火
148
记一次Webshell流量分析2 | 添柴不加火