一个Agent的基本组成应该包含如下四个方面规划 (planning), 工具 (Tools), 执行 (Action), 和记忆(Memory)。

智能体决策(Agent Planning)
ReAct(Yao et al.)

ReWoo(Binfeng Xu et al.)

智能体记忆模块(Agent Memory)
图二、Agent Memory分类(Lilian Weng et, al.)
现在的agent memory机制分为了
感觉记忆: 这是记忆的最早阶段,能够在原始刺激结束后保留感官信息(视觉、听觉等)的印象。短期记忆(STM) 以及长期记忆(LTM)。
个人认为斯坦福的Generative Agents (Joon Sung Park et al.) 的工作对Memory这块进行了相对不错的探索和设计,由于agent在每次模拟中会产生大量的文本,所以作者使用了一个抽取(Retrieve) 模块去获取对当前执行相对更有用的内容,并且使用模型不断去**反馈(Reflect)**优化更改之前的记忆。
Agent基于Memory这块还有一个重要的运用就是 抽取增强式生成 (Retrieval-Augmented Generation,RAG), 例如与数据库交互等等。
总而言之,agent基于memory机制的探索还有很大空间。

Agent能力评测(Evaluation Benchmark)
AgentBench(Xiao Liu, et al.)

ToolEval(Qin, et al.)

ToolEval在16000+ RapidAPI构成的ToolBench上评估模型的工具运用能力,也是当前相对完善的工具学习评测数据集。
