[论文笔记] Agent is all you need | AI智能体前沿进展总结

一个Agent的基本组成应该包含如下四个方面规划 (planning), 工具 (Tools), 执行 (Action), 和记忆(Memory)。

智能体决策(Agent Planning)

ReAct(Yao et al.)

ReWoo(Binfeng Xu et al.)

智能体记忆模块(Agent Memory)

图二、Agent Memory分类(Lilian Weng et, al.)

现在的agent memory机制分为了

感觉记忆: 这是记忆的最早阶段,能够在原始刺激结束后保留感官信息(视觉、听觉等)的印象。短期记忆(STM) 以及长期记忆(LTM)。

个人认为斯坦福的Generative Agents (Joon Sung Park et al.) 的工作对Memory这块进行了相对不错的探索和设计,由于agent在每次模拟中会产生大量的文本,所以作者使用了一个抽取(Retrieve) 模块去获取对当前执行相对更有用的内容,并且使用模型不断去**反馈(Reflect)**优化更改之前的记忆。

Agent基于Memory这块还有一个重要的运用就是 抽取增强式生成 (Retrieval-Augmented Generation,RAG), 例如与数据库交互等等。

总而言之,agent基于memory机制的探索还有很大空间。

Agent能力评测(Evaluation Benchmark)

AgentBench(Xiao Liu, et al.)

ToolEval(Qin, et al.)

ToolEval在16000+ RapidAPI构成的ToolBench上评估模型的工具运用能力,也是当前相对完善的工具学习评测数据集。

相关推荐
薛定e的猫咪2 天前
【AAAI 2025】基于扩散模型的昂贵多目标贝叶斯优化
论文阅读·人工智能·算法
YMWM_2 天前
论文阅读“SimVLA: A Simple VLA Baseline for Robotic Manipulation“
论文阅读·vla
m0_650108242 天前
VLN-Zero:零样本机器人导航的神经符号视觉语言规划框架
论文阅读·零样本·机器人导航·视觉语言导航·未知环境快速适配·符号化场景图·vlm推理
晓山清3 天前
【论文阅读】Self-supervised Learning of Person-specific Facial Dynamics for APR
论文阅读
张较瘦_3 天前
[论文阅读] AI + 教育 | 不是单纯看视频!软件工程培训的游戏化融合之道
论文阅读·人工智能·软件工程
张较瘦_3 天前
[论文阅读] AI + 软件工程 | 用统计置信度破解AI功能正确性评估难题——SCFC方法详解
论文阅读·人工智能·软件工程
Matrix_114 天前
论文阅读--Agent AI 探索多模态交互的前沿领域(二)
论文阅读·人工智能
万里鹏程转瞬至5 天前
论文简读 | TurboDiffusion: Accelerating Video Diffusion Models by 100–200 Times
论文阅读·深度学习·aigc
Matrix_115 天前
论文阅读--Agent AI 探索多模态交互的前沿领域(一)
论文阅读·人工智能
@––––––6 天前
论文阅读笔记:π 0 : A Vision-Language-Action Flow Model for General Robot Control
论文阅读·笔记