登录
/
注册
首页
论坛
其它
首页
科技
业界
安全
程序
广播
Follow
关于
导读
排行榜
资讯
发帖说明
登录
/
注册
账号
自动登录
找回密码
密码
登录
立即注册
搜索
搜索
关闭
CSDN热搜
程序园
精品问答
技术交流
资源下载
本版
帖子
用户
软件
问答
教程
代码
写记录
写博客
小组
VIP申请
VIP网盘
网盘
联系我们
发帖说明
道具
勋章
任务
淘帖
动态
分享
留言板
导读
设置
我的收藏
退出
腾讯QQ
微信登录
返回列表
首页
›
业界区
›
业界
›
Codex 5.3 与 Opus 4.6 同日升级,AI Agent今年要爆发了 ...
Codex 5.3 与 Opus 4.6 同日升级,AI Agent今年要爆发了
[ 复制链接 ]
峰埋姚
2026-2-7 00:45:01
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
Codex 5.3 与 Opus 4.6 同日升级,AI 编码竞争从“会写”转向“能闭环”
2026真的是 AI Agent 爆发的一年。OpenAI 与 Anthropic 几乎前后脚发布新版本:GPT-5.3-Codex 与 Claude Opus 4.6。再叠加国内大模型在 1月到2月的密集动作,现在看来,智能体的发展速度,已经超出大多数人的预料了,我们都需要紧跟脚步。
发生了什么
2月5日,OpenAI 发布 GPT-5.3-Codex,定位是更强的 agentic coding 模型,覆盖 Codex App、CLI、IDE 扩展与 Web。
同一天,Anthropic 发布 Claude Opus 4.6,重点强调长任务、长上下文与工程稳定性。
同日升级这件事本身就是信号:头部厂商已经把“开发者工作流”当成最核心战场。
有什么提升和改变
这一部分按官方披露口径展开。
先看 OpenAI。官方给了比较明确的性能描述和对比数据:
在 Codex 使用场景中,GPT-5.3-Codex 相比 GPT-5-Codex,官方称整体速度约提升 25%。
在 SWE-Bench Pro 上,GPT-5.3-Codex 为 56.8,GPT-5-Codex 为 56.4,属于小幅提升。
在 Terminal-Bench 2.0 上,GPT-5.3-Codex 为 77.3,GPT-5-Codex 为 64.0,提升更明显。
在 OSWorld Verified 上,GPT-5.3-Codex 为 64.7,GPT-5-Codex 为 38.2,跨任务执行能力的提升幅度非常大。
指标GPT-5.3-CodexGPT-5-Codex变化解读Codex 场景整体速度+25%(官方口径)基线交互和长任务执行节奏更快SWE-Bench Pro56.856.4小幅提升,说明基础修复能力继续优化Terminal-Bench 2.077.364.0大幅提升,终端多步任务更稳OSWorld Verified64.738.2显著提升,跨工具/跨环境任务能力加强换句话说,OpenAI 这次最关键的升级点,不是“写一段代码更优雅”,而是“在多步骤、多工具、多文件任务里更稳”。
再看 Anthropic。Opus 4.6 的官方叙事重点有三点:
首次把 Opus 系列推进到 1M 上下文窗口(测试能力),直接服务长文档和长链路任务。
在官方展示中,Terminal-Bench 2.0 达到 65.4,OSWorld 达到 72.7,继续强化端到端任务执行能力。
价格口径保持不变,意图很明确:在不提高使用门槛的前提下,拉高复杂任务成功率。
所以这轮变化可以总结成一句话:模型厂商正在把“代码生成工具”升级为“软件工程执行代理”。
国内模型的最近动作
国内阵营这段时间也很密集,而且都在往“工程化可用”方向卷。
百度这边,2026年1月22日发布文心大模型 5.0。官方披露的关键词是“原生多模态、超大参数规模、综合能力升级”,并强调在多项公开基准上的竞争力。对企业用户来说,这意味着百度正在把文心从通用对话进一步推向多场景生产。
阿里云通义这边,2026年1月23日版本号 qwen3-max-2026-01-23 已在模型服务侧上线,思考模式标识为 Qwen3-Max-Thinking。官方描述重点放在更强推理、更强 Agent 任务处理和工具调用能力,定位是可直接进入业务工作流的旗舰模型。
DeepSeek 据说马上要发布 DeepSeek V4,主打编码能力。截至2026年2月6日,官方仍未给出 V4 正式发布公告。
智谱这边,GLM-5 在2026年1月初有“将很快推出”的对外信息,但截至2026年2月6日,尚未看到完整官方发布页落地。
如果做一个阶段性预估:国内大模型在2026年上半年很可能出现“旗舰扎堆发布 + 价格快速调整 + Agent 场景落地提速”的三连动。
另外,阿里在千问上已经开始打通生活圈,包括电商、导航、旅游、支付,甚至是政务民生,要成为一个大帝国。这个能力恐怕全球独一份了
AI Agent 智能体正在加速进化
AI Agent 对所有人的影响,已经从“可选工具”变成“基础能力差距”。
对程序员来说,变化是工作重心迁移。你写的纯代码会减少,但你定义任务、拆解需求、设计验证、管理上下文的能力会成为新核心。
对产品和运营来说,变化是执行方式重构。过去要多人协作一周的内容整理、数据分析、方案迭代,未来可能由“人定方向 + Agent 连续执行”在一天内完成。
对企业管理者来说,变化是组织效率和组织结构。很多岗位不会消失,但“人机协作比”会快速变化,团队将从按岗位分工转向按任务闭环分工。
对普通用户来说,变化是信息处理门槛被拉平。未来的差距不再是“会不会用某个软件”,而是“会不会把目标描述清楚,并持续驱动 Agent 直到拿到可用结果”。
未来 6 到 12 个月,最现实的预估是:
Agent 会先在高重复、可验证、可审计的场景里规模化。
跨系统自动执行会增加,但权限治理和审计会成为刚需。
个人生产力差距会被进一步放大,会“定义任务和验收结果”的人会显著领先。
小结
从2026年2月这轮更新看,AI 编码竞争的核心已经非常清晰:谁能更稳定地完成复杂任务,谁就能拿到下一阶段的话语权。
Codex 5.3 与 Opus 4.6 的同日升级,加上文心 5、Qwen3-Max-Thinking、DeepSeek V4、GLM-5 的连续动作,说明2026年的主线不是“模型会不会写代码”,而是“模型能不能作为可控的工程执行者进入真实生产”。
作者简介:
10年+视频技术、后端架构、AI应用开发经验,曾任某互联网大厂技术专家。对AI编程工具、云原生架构、视频处理技术有深入研究。
合作请加WX:hbstream
(http://haibindev.cnblogs.com),转载请注明作者和出处
来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
Codex
Opus
同日
升级
AI
相关帖子
当AI编程进入「Vibe Coding」模式:从脑洞到MVP产品
Visual Paradigm AI 可视化建模全面指南
AI 工厂 #01|工业系统如何引入 Agent
AI元人文:制造、部署应用与养护AI(岐式参考)
AI开发-python-milvus向量数据库(2-6 -milvus-collection查看、加载、释放)
人类责任主义——AI治理作为创新的源头,人机共生作为意义的归宿
AI开发-python-milvus向量数据库(2-7 -milvus-精确使用模式创建collection)
AI 学习笔记:Agent 的基础应用
赋予 AI Agent “无限续航”:语义保护型上下文压缩技术解析
AI开发-python-milvus向量数据库(2-8 -milvus-数据插入collection)
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
照妖镜
相关推荐
安全
当AI编程进入「Vibe Coding」模式:从脑洞到MVP产品
1
291
摹熹
2026-02-16
科技
Visual Paradigm AI 可视化建模全面指南
2
699
王妍芳
2026-02-16
安全
AI 工厂 #01|工业系统如何引入 Agent
0
162
飧沾
2026-02-16
安全
AI元人文:制造、部署应用与养护AI(岐式参考)
0
969
琉艺戕
2026-02-16
安全
AI开发-python-milvus向量数据库(2-6 -milvus-collection查看、加载、释放)
0
213
蓟晓彤
2026-02-17
业界
人类责任主义——AI治理作为创新的源头,人机共生作为意义的归宿
0
444
巴沛若
2026-02-18
安全
AI开发-python-milvus向量数据库(2-7 -milvus-精确使用模式创建collection)
1
26
辖瑁地
2026-02-18
业界
AI 学习笔记:Agent 的基础应用
0
334
倡遍竽
2026-02-18
业界
赋予 AI Agent “无限续航”:语义保护型上下文压缩技术解析
1
405
陆菊
2026-02-19
安全
AI开发-python-milvus向量数据库(2-8 -milvus-数据插入collection)
0
65
垢峒
2026-02-20
回复
(15)
骆贵
2026-2-8 10:34:22
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
这个好,看起来很实用
拓炊羡
2026-2-8 11:41:01
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
鼓励转贴优秀软件安全工具和文档!
郗燕岚
2026-2-9 00:08:20
回复
使用道具
举报
照妖镜
程序园永久vip申请,500美金$,无限下载程序园所有程序/软件/数据/等
感谢分享,下载保存了,貌似很强大
嗳诿
2026-2-9 05:02:56
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
新版吗?好像是停更了吧。
烯八
2026-2-9 22:21:01
回复
使用道具
举报
照妖镜
程序园永久vip申请,500美金$,无限下载程序园所有程序/软件/数据/等
懂技术并乐意极积无私分享的人越来越少。珍惜
胆饬
2026-2-10 03:41:59
回复
使用道具
举报
照妖镜
程序园永久vip申请,500美金$,无限下载程序园所有程序/软件/数据/等
感谢分享
频鹏凶
2026-2-10 03:43:29
回复
使用道具
举报
照妖镜
程序园永久vip申请,500美金$,无限下载程序园所有程序/软件/数据/等
yyds。多谢分享
稼布欤
2026-2-11 04:52:41
回复
使用道具
举报
照妖镜
程序园永久vip申请,500美金$,无限下载程序园所有程序/软件/数据/等
过来提前占个楼
百里宵月
2026-2-11 13:05:16
回复
使用道具
举报
照妖镜
程序园永久vip申请,500美金$,无限下载程序园所有程序/软件/数据/等
鼓励转贴优秀软件安全工具和文档!
国语诗
2026-2-11 15:26:13
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
yyds。多谢分享
印萍
7 天前
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
新版吗?好像是停更了吧。
皆炳
7 天前
回复
使用道具
举报
照妖镜
程序园永久vip申请,500美金$,无限下载程序园所有程序/软件/数据/等
谢谢分享,试用一下
硫辨姥
7 天前
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
这个有用。
艾曼语
前天 12:29
回复
使用道具
举报
照妖镜
程序园永久vip申请,500美金$,无限下载程序园所有程序/软件/数据/等
过来提前占个楼
闻成
昨天 04:09
回复
使用道具
举报
照妖镜
程序园永久vip申请,500美金$,无限下载程序园所有程序/软件/数据/等
很好很强大 我过来先占个楼 待编辑
琉艺戕
10 小时前
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
很好很强大 我过来先占个楼 待编辑
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
回复
本版积分规则
回帖并转播
回帖后跳转到最后一页
浏览过的版块
安全
签约作者
程序园优秀签约作者
发帖
峰埋姚
10 小时前
关注
0
粉丝关注
24
主题发布
板块介绍填写区域,请于后台编辑
财富榜{圆}
3934307807
991124
anyue1937
9994892
kk14977
6845359
4
xiangqian
638210
5
宋子
9898
6
韶又彤
9918
7
闰咄阅
9993
8
刎唇
9995
9
蓬森莉
9883
10
遗憩
10006
查看更多
今日好文热榜
385
SeeDance2.0提示词之跳舞女孩
6
SeeDance2.0提示词之跳舞女孩
680
国内零门槛首个免费 开源 7×24小时帮
570
[拆解LangChain执行引擎]非常规Pending Wri
65
AI开发-python-milvus向量数据库(2-8 -mil
77
[LKD/Linux 内核] 关于对 current_thread_i
6
[LKD/Linux 内核] 关于对 current_thread_i
5
[LKD/Linux 内核] 关于对 current_thread_i
537
杂题选做(3)
4
9、PipedInputStream和PipedOutputStream的
753
凸优化数学基础笔记(五):极小值点的判定
856
【节点】[MainLightRealtimeShadow节点]原
11
【渗透测试】HTB靶场之WingData 全过程wp
381
2023年电赛国赛经历
534
从零开始学Flink:实时数仓与维表时态Join
987
Stanford-CS336-Lecture-01 学习理解
663
FastAPI实战:WebSocket长连接保持与心跳机
362
FPGA使用镜像加载技术来切换运行中的比特流