[论文笔记] Agent is all you need | AI智能体前沿进展总结

心心喵2026-01-27 9:25

一个Agent的基本组成应该包含如下四个方面规划（planning), 工具（Tools), 执行 (Action), 和记忆(Memory)。

智能体决策(Agent Planning)

ReAct(Yao et al.)

ReWoo(Binfeng Xu et al.)

智能体记忆模块（Agent Memory）

图二、Agent Memory分类（Lilian Weng et, al.)

现在的agent memory机制分为了

感觉记忆： 这是记忆的最早阶段，能够在原始刺激结束后保留感官信息（视觉、听觉等）的印象。短期记忆（STM） 以及长期记忆（LTM）。

个人认为斯坦福的Generative Agents （Joon Sung Park et al.) 的工作对Memory这块进行了相对不错的探索和设计，由于agent在每次模拟中会产生大量的文本，所以作者使用了一个抽取(Retrieve) 模块去获取对当前执行相对更有用的内容，并且使用模型不断去**反馈(Reflect)**优化更改之前的记忆。

Agent基于Memory这块还有一个重要的运用就是 抽取增强式生成 (Retrieval-Augmented Generation，RAG）, 例如与数据库交互等等。

总而言之，agent基于memory机制的探索还有很大空间。

Agent能力评测(Evaluation Benchmark）

AgentBench（Xiao Liu, et al.)

ToolEval（Qin, et al.)

ToolEval在16000+ RapidAPI构成的ToolBench上评估模型的工具运用能力，也是当前相对完善的工具学习评测数据集。