登录
/
注册
首页
论坛
其它
首页
科技
业界
安全
程序
广播
Follow
关于
导读
排行榜
资讯
发帖说明
登录
/
注册
账号
自动登录
找回密码
密码
登录
立即注册
搜索
搜索
关闭
CSDN热搜
程序园
精品问答
技术交流
资源下载
本版
帖子
用户
软件
问答
教程
代码
写记录
写博客
小组
VIP申请
VIP网盘
网盘
联系我们
发帖说明
道具
勋章
任务
淘帖
动态
分享
留言板
导读
设置
我的收藏
退出
腾讯QQ
微信登录
返回列表
首页
›
业界区
›
业界
›
"INMS: Memory Sharing for Large Language Model based ...
"INMS: Memory Sharing for Large Language Model based Agents" 论文笔记
[ 复制链接 ]
赫连如冰
前天 11:10
程序园永久vip申请,无限下载程序园所有程序/软件/数据/等
背景
现有的 memory 工作主要都关注 Agent 独立利用自身存储的记忆来完成任务,这种孤立的范式忽视了 Agents 间的互动和集体记忆的巨大潜力。当前方法常常未能模拟复杂多代理环境中自然发生的异步对话和知识交流,忽视了拥有独特对话历史和专业培训的 Agents 之间的固有多样性和互补性
因此本文提出了 INMS 框架,将范式从孤立推理转变为隐式且高效的异步对话机制。通过互动学习促进动态记忆共享,INMS 建立了一个无需依赖外部静态数据库的共享对话场地
方法
(1) 记忆生成与选择
记忆本质上是 Prompt-Answer 对(PA pair),每次交互后,对于每个新生成的记忆,LLM 评分器会给它进行评分并决定是否将其加入共享记忆池
首先使用 LLM 查询以获取各种评分标准,然后再用 LLM 评估提取最合理的评分标准,经过人工审核后最终确定。每个新生成的记忆将与相应评分标准合并并提交给 LLM 评分器。如果 PA pair 的分数超过预设阈值,答案及其对应提示会被打包为有用内存并存储在内存中
(2) 记忆检索与训练
记忆检索:
会有一小部分实例被手动归档到记忆池中用于初始化,在回答阶段,Agent 利用密集向量相似度检索的方式从共享记忆池中提取记忆。这些提取的记忆与问题结合,形成一个 prompt 提交给 Agent
记忆训练:
每当新的 PA pair 加入记忆池,会使用 BM25 确定最相关的 n 个候选对,然后利用 LLM 给候选对中的输出与新记忆输出相矛盾的概率打分(类似于对话交互机制)。获得的标记数据用于最小化设计的损失函数
(3) 交互式学习
本文说通过评分识别出的高质量 PA pair 被添加到记忆池中,从而加速记忆增长和 Agents 自我增强
实验
(1) 共享记忆的表现
在所有任务中,与不使用共享记忆相比,所有智能体的性能都有显著提升。这表明,来自其他任务的可共享记忆可以帮助智能体获得期望的答案,而不是干扰智能体的学习能力
(2) 跨域共享记忆的表现
作者还构建了一个额外的存储池——集成存储池,将所有域中所有智能体的可共享记忆合并到一个存储池中。然而,如图所示,尽管集成池可以增强共享记忆的多样性,但领域特定池更有效地使智能体能够生成可靠的答案
(3) 演化机制的表现
在设定不同比例的有偏见数据进行初始化后,尽管最初的偏见池严重干扰了代理在早期互动中的反应(因为他们反复检索并参考有缺陷的例子),但不断涌入的动态过滤记忆逐渐稀释了这种偏见。因此最终智能体的表现反弹,最终接近无偏情景中观察到的峰值分数
总结
是一篇对多智能体共享记忆很好的研究工作,提出了一种共享记忆的高质量演化方法
来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
quot
INMS
Memory
Sharing
for
相关帖子
AI渗透测试工具:从"脚本跑腿"到"Agent大脑"的范式革命
SimpleVQA: Multimodal Factuality Evaluation for Multimodal Large Language Models
"给我发个200元红包":一条群消息背后的 AI 安全危机
这个新闻居然是真的——一颗大脑被"上传"进电脑,然后"活"了
老板:"996是福报!",我:"雷总说未来3天2小时,您咋不说?"
没开电脑! 只用手机和QQ聊天, 让openClaw帮我"手搓"个AI新闻网站
河南爱彼爱和新材料 | 打造低成本高敏捷数字化转型的"河南标杆"
"Memory in the Age of AI Agents: A Survey" 论文笔记
基于范围的for循环
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
照妖镜
相关推荐
科技
AI渗透测试工具:从"脚本跑腿"到"Agent大脑"的范式革命
1
507
热琢
2026-03-01
安全
SimpleVQA: Multimodal Factuality Evaluation for Multimodal Large Language Models
1
542
穆望
2026-03-09
业界
"给我发个200元红包":一条群消息背后的 AI 安全危机
2
777
鞭氅
2026-03-10
业界
这个新闻居然是真的——一颗大脑被"上传"进电脑,然后"活"了
0
26
稞冀
2026-03-11
安全
老板:"996是福报!",我:"雷总说未来3天2小时,您咋不说?"
0
106
莅耸
2026-03-13
业界
没开电脑! 只用手机和QQ聊天, 让openClaw帮我"手搓"个AI新闻网站
0
466
艺轫
2026-03-16
安全
河南爱彼爱和新材料 | 打造低成本高敏捷数字化转型的"河南标杆"
0
166
龙梨丝
2026-03-17
安全
"Memory in the Age of AI Agents: A Survey" 论文笔记
0
765
拼匍弦
2026-03-22
业界
基于范围的for循环
0
882
糙昧邵
2026-03-26
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
回复
本版积分规则
回帖并转播
回帖后跳转到最后一页
签约作者
程序园优秀签约作者
发帖
赫连如冰
前天 11:10
关注
0
粉丝关注
22
主题发布
板块介绍填写区域,请于后台编辑
财富榜{圆}
3934307807
991125
anyue1937
9994892
kk14977
6845359
4
xiangqian
638210
5
神泱
9522
6
韶又彤
9916
7
宋子
9878
8
荪俗
9020
9
闰咄阅
9997
10
刎唇
9999
查看更多
今日好文热榜
583
Qt 技巧笔记(十四):QTableWidget 表格组
261
【JavaScript高级编程】拆解函数流水线 上
445
Claude 绝密模型泄露!Sora 关停、AI 工具
390
P10387 [蓝桥杯 2024 省 A] 训练士兵
113
电容是什么?一个“快充快放”的微型充电宝
947
做了一个网页天气可视化 2
696
Redis命令处理机制源码探究
725
读2025世界前沿技术发展报告27核力量
3
读2025世界前沿技术发展报告27核力量
4
读2025世界前沿技术发展报告27核力量
4
读2025世界前沿技术发展报告27核力量
3
读2025世界前沿技术发展报告27核力量
3
读2025世界前沿技术发展报告27核力量
3
Claude 绝密模型泄露!Sora 关停、AI 工具
3
做了一个网页天气可视化 2
3
做了一个网页天气可视化 2
3
Redis命令处理机制源码探究
3
【JavaScript高级编程】拆解函数流水线 上
3
Claude 绝密模型泄露!Sora 关停、AI 工具
3
Claude 绝密模型泄露!Sora 关停、AI 工具