Novel problem-solving(ARC AGI 2):是评估 AI 解决全新、未见过的复杂问题的能力,比如逻辑推理、数学证明或抽象概念理解,它测试的是 AI 能否像人类一样,通过已有知识灵活组合,找到创新解法。
简单来说,该指标的提升意味着 AI 未来陪你一起“开脑洞”的能力更强了,创新能力找 AI 也没有任何问题。
该指标从原本的 37.6% 升高到了 68.8% ,提升显著!
Opus4.6 支持 1M Token 的上下文窗口
除了上述模型指标有较高提示外,原本的 Opus4.5 上下文窗口是支持 200K,本次直接升级到了 1M,足足翻了五倍!
上下文窗口对于 AI Coding 是有非常重要的含义,上下文不足容易导致 AI Coding 质量下降,本次直接升级到 1M 上下文窗口,AI Coding 开发者的福音!
Claude Code 升级
本次 Claude Code 升级了 agent-teams 的功能。
以前,我们想让 Claude Code 并行跑多个任务的时候,比较简陋的做法是,每次都打开一个新的 CLI 终端,然后 Claude Code 在不同的终端进行执行。
再或者就是直接采用 sub agent,但 sub agent 的问题是,这些程序在单一会话内运行,只能向主代理汇报。
而本次更新的 agent teams 功能,则是各个 Agent 队友各自独立工作,各自在自己的上下文窗口中,并直接相互沟通!
是的,并不是各个 Agent 向主代理汇报,而是各个 Agent 在自己的上下文窗口中,独自运行,且各个 Agent 之间可以直接沟通,互相协作!完全并行!
不过,由于该功能还是一个实验功能,所以默认在 Claude Code 中是被禁用的,我们可以直接调整 Claude Code 的 setting.json 配置来开启它:
{
"env": {
"CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS": "1"
}
}
复制代码
开启该配置后,多个Claude Code实例之间进行团队协作,共享任务的能力将大大加强!
Claude 团队针对 Claude Code 并行处理能力也单独录制了一部视频,感兴趣的可以直接在这里查看:
https://www.youtube.com/watch?v=vNeIQS9GsZ8
除此之外,关于Agent teams 能力的详细说明,也可以查看 Claude 官网的最新更新,文档地址是:
https://code.claude.com/docs/en/agent-teams
今年极大可能是Agent 的元年,无论是前段时间爆火的OpenClaw,还是最近 Claude 和 GPT 的模型更新,都直指模型Agent能力的提升,无论是写代码,操作浏览器,还是控制操作系统,模型现在都有了较大升级!
跟上节奏!还没用过 Claude Code 今年一定要体验一下!这是入局的最好时机!
入局早了你会觉得 Claude Code 垃圾,入局晚了你会跟不上 Claude Code 的节奏,现在入局正当时。
来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!