[论文笔记] Agent is all you need | AI智能体前沿进展总结

一个Agent的基本组成应该包含如下四个方面规划 (planning), 工具 (Tools), 执行 (Action), 和记忆(Memory)。

智能体决策(Agent Planning)

ReAct(Yao et al.)

ReWoo(Binfeng Xu et al.)

智能体记忆模块(Agent Memory)

图二、Agent Memory分类(Lilian Weng et, al.)

现在的agent memory机制分为了

感觉记忆: 这是记忆的最早阶段,能够在原始刺激结束后保留感官信息(视觉、听觉等)的印象。短期记忆(STM) 以及长期记忆(LTM)。

个人认为斯坦福的Generative Agents (Joon Sung Park et al.) 的工作对Memory这块进行了相对不错的探索和设计,由于agent在每次模拟中会产生大量的文本,所以作者使用了一个抽取(Retrieve) 模块去获取对当前执行相对更有用的内容,并且使用模型不断去**反馈(Reflect)**优化更改之前的记忆。

Agent基于Memory这块还有一个重要的运用就是 抽取增强式生成 (Retrieval-Augmented Generation,RAG), 例如与数据库交互等等。

总而言之,agent基于memory机制的探索还有很大空间。

Agent能力评测(Evaluation Benchmark)

AgentBench(Xiao Liu, et al.)

ToolEval(Qin, et al.)

ToolEval在16000+ RapidAPI构成的ToolBench上评估模型的工具运用能力,也是当前相对完善的工具学习评测数据集。

相关推荐
大模型最新论文速读14 小时前
06-11 · LLM 最新论文速览
论文阅读·人工智能·深度学习·机器学习·自然语言处理
Biomamba生信基地3 天前
空间图谱+注释工具= 《ADVANCED SCIENCE》
论文阅读·生物信息学·单细胞分析·空间转录组·细胞图谱
c7693 天前
【文献笔记】Learn to Relax with LLMs: Solving COPs via Bidirectional Coevolution
论文阅读·人工智能·笔记·语言模型·论文笔记·提示工程
StfinnWu4 天前
论文阅读:Spatial Frequency Modulation Network for EfficientImage Dehazing
论文阅读
Rocky Ding*4 天前
Token Merging for Fast Stable Diffusion:一篇读懂 Stable Diffusion 的免训练加速机制
论文阅读·人工智能·深度学习·机器学习·stable diffusion·aigc·ai-native
大模型最新论文速读4 天前
小红书提出 RedKnot:分头处理 kv 缓存,延时降低 60%效果还提升
论文阅读·人工智能·深度学习·机器学习·缓存·自然语言处理
传说故事5 天前
【论文阅读】DATA SCALING LAWS IN IMITATION LEARNING FOR ROBOTIC MANIPULATION
论文阅读·人工智能·机器人·具身智能
小马哥crazymxm5 天前
Arxiv论文周选 (2026-W23)
论文阅读·人工智能·科技
大模型最新论文速读5 天前
06-10 · LLM 最新论文速览
论文阅读·人工智能·深度学习·机器学习·自然语言处理
传说故事5 天前
【论文阅读】WorldArena 2.0:扩展具身世界模型在模态性、功能性与平台上的基准测试
论文阅读·人工智能·具身智能·世界模型