登录
/
注册
首页
论坛
其它
首页
科技
业界
安全
程序
广播
Follow
关于
导读
排行榜
资讯
发帖说明
登录
/
注册
账号
自动登录
找回密码
密码
登录
立即注册
搜索
搜索
关闭
CSDN热搜
程序园
精品问答
技术交流
资源下载
本版
帖子
用户
软件
问答
教程
代码
写记录
写博客
小组
VIP申请
VIP网盘
网盘
联系我们
发帖说明
道具
勋章
任务
淘帖
动态
分享
留言板
导读
设置
我的收藏
退出
腾讯QQ
微信登录
返回列表
首页
›
业界区
›
业界
›
"Natural-Language Agent Harnesses" 论文笔记 ...
"Natural-Language Agent Harnesses" 论文笔记
[ 复制链接 ]
甦忻愉
昨天 20:47
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
背景
Agent 系统的性能越来越依赖 Harness,但这些逻辑通常藏在代码里、框架默认设置里,或者特定运行时的各种约定里。结果就是很难把一个 Harness 移植到另一个系统、拿来比较,或者系统性地研究改进
作者提出把 Harness 的高层控制逻辑从代码中抽出来,用自然语言写成一个可编辑、可移植的文档,叫
Natural-Language Agent Harnesses (NLAH)
。然后设计一个共享的运行时
Intelligent Harness Runtime (IHR)
,让 LLM 直接读懂这个自然语言描述,并按照里面的规则去执行任务
方法
本文认为 Harness 是管理任务族的多个模型或智能体的一个模式层,其指定:控制(如何分解和安排工作);契约(必须生产哪些工件、满足哪些条件、何时停止运行);说明(每个步骤和分支坚持的内容)
(1) NLAH
与 OpenAI 的报告一样,NLAH 是有明确结构的自然语言文档,通常放在类似 harness-skill/SKILL.md 的文件里。具体而言,其包含以下部分:
Contracts
:定义输入输出格式、验证规则、停止条件、重试次数。比如 "必须输出有效的 Python 代码文件 solution.py,否则重新生成"
Roles
:给不同子代理分配职责和 prompt,比如 Planner 负责出计划,Solver 负责写代码,Verifier 负责跑测试,Debugger 负责修复
Stage Structure
:描述工作流拓扑,比如 "先 PLAN → 再 EXECUTE → 然后 VERIFY → 失败就进入 REPAIR,最多重试 3 次"
Adapters/Scripts
:命名一些确定性的钩子,比如跑测试的脚本、解析输出的工具
State Semantics
:说明状态怎么持久化(推荐用文件),比如通过路径重新打开 artifact
Failure Taxonomy
:给常见失败起名字并定义处理方式,比如 "test_failure" 就跳到 REPAIR 阶段,"tool_error" 就重试一次
(2) IHR
具体而言,
IHR
是个共享运行时,里面有个 "in-loop LLM" 负责不停解读 NLAH、当前状态和一个叫
Runtime Charter
(运行时宪章)的共享规则
它把任务拆成父子代理:父代理轻量级,只管调度;子代理干实际活
状态用文件持久化,放在固定路径下,便于重启和审计
每次行动前都会检查 contracts,失败就按 taxonomy 处理
关键是把运行时通用规则 和 具体任务 harness分开,避免污染
实验
可以看到 Harness 显著改变了行为(工具调用、LLM 调用、运行时间),但 Performance 变化不大;此外,不是所有模块都有用,有些模块(如 verifier)因为 overhead,在小样本上反而没明显提升甚至略降
总结
这篇工作更像是一次显式化 Harness 的初步探索,利用自然语言形态的 Harness 可以增加可解释性和可迁移能力,让 Harness 成功抽象出来。但在小样本实验下,NLAH 虽然显著影响了智能体的运行逻辑,成功率并无显著提升。由于预算有限,作者说后续会在大规模实验来继续探究
来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
quot
Natural
Language
Agent
Harnesses
相关帖子
Agent Skill 专业的事情交给专业的 Skill
0基础教你快速写自己的Agent Skills
"Meta-Harness: End-to-End Optimization of Model Harnesses" 论文笔记
Microsoft Agent Framework + Kimi API 实战:控制台应用跑通单次与多轮 Agent 对话
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
照妖镜
相关推荐
安全
Agent Skill 专业的事情交给专业的 Skill
1
530
准挝
2026-04-03
业界
0基础教你快速写自己的Agent Skills
0
5
仲水悦
2026-04-05
安全
"Meta-Harness: End-to-End Optimization of Model Harnesses" 论文笔记
1
277
宋子
2026-04-06
业界
Microsoft Agent Framework + Kimi API 实战:控制台应用跑通单次与多轮 Agent 对话
0
78
彼瞄
2026-04-06
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
回复
本版积分规则
回帖并转播
回帖后跳转到最后一页
浏览过的版块
安全
签约作者
程序园优秀签约作者
发帖
甦忻愉
昨天 20:47
关注
0
粉丝关注
16
主题发布
板块介绍填写区域,请于后台编辑
财富榜{圆}
3934307807
991126
anyue1937
9994892
kk14977
6845359
4
xiangqian
638210
5
神泱
9518
6
韶又彤
9909
7
荪俗
8992
8
宋子
9875
9
蓬森莉
9869
10
俞瑛瑶
10000
查看更多
今日好文热榜
34
从分形到森林——使用 Three.js 创建逼真的
264
从分形到森林——使用 Three.js 创建逼真的
619
AI 编程助手 + 基于 CLI 的 Manus 实现(Ja
40
AI 编程助手 + 基于 CLI 的 Manus 实现(Ja
601
从分形到森林——使用 Three.js 创建逼真的
723
从分形到森林——使用 Three.js 创建逼真的
17
AI 编程助手 + 基于 CLI 的 Manus 实现(Ja
939
从分形到森林——使用 Three.js 创建逼真的
483
从分形到森林——使用 Three.js 创建逼真的
933
从分形到森林——使用 Three.js 创建逼真的
78
从分形到森林——使用 Three.js 创建逼真的
742
从分形到森林——使用 Three.js 创建逼真的
500
AI 编程助手 + 基于 CLI 的 Manus 实现(Ja
380
从分形到森林——使用 Three.js 创建逼真的
97
从分形到森林——使用 Three.js 创建逼真的
599
从分形到森林——使用 Three.js 创建逼真的
709
React 技术深度探讨
253
从分形到森林——使用 Three.js 创建逼真的
304
从分形到森林——使用 Three.js 创建逼真的
961
从分形到森林——使用 Three.js 创建逼真的