[论文笔记] Agent is all you need | AI智能体前沿进展总结

一个Agent的基本组成应该包含如下四个方面规划 (planning), 工具 (Tools), 执行 (Action), 和记忆(Memory)。

智能体决策(Agent Planning)

ReAct(Yao et al.)

ReWoo(Binfeng Xu et al.)

智能体记忆模块(Agent Memory)

图二、Agent Memory分类(Lilian Weng et, al.)

现在的agent memory机制分为了

感觉记忆: 这是记忆的最早阶段,能够在原始刺激结束后保留感官信息(视觉、听觉等)的印象。短期记忆(STM) 以及长期记忆(LTM)。

个人认为斯坦福的Generative Agents (Joon Sung Park et al.) 的工作对Memory这块进行了相对不错的探索和设计,由于agent在每次模拟中会产生大量的文本,所以作者使用了一个抽取(Retrieve) 模块去获取对当前执行相对更有用的内容,并且使用模型不断去**反馈(Reflect)**优化更改之前的记忆。

Agent基于Memory这块还有一个重要的运用就是 抽取增强式生成 (Retrieval-Augmented Generation,RAG), 例如与数据库交互等等。

总而言之,agent基于memory机制的探索还有很大空间。

Agent能力评测(Evaluation Benchmark)

AgentBench(Xiao Liu, et al.)

ToolEval(Qin, et al.)

ToolEval在16000+ RapidAPI构成的ToolBench上评估模型的工具运用能力,也是当前相对完善的工具学习评测数据集。

相关推荐
大模型最新论文速读13 小时前
PreFT:只在 prefill 时使用 LoRA,推理速度翻倍效果不降
论文阅读·人工智能·深度学习·机器学习·自然语言处理
西柚小萌新13 小时前
【论文阅读】--ORCA:面向文档视觉问答的协作智能体协同推理
论文阅读
数智工坊17 小时前
【UniT论文阅读】:用统一物理语言打通人类与人形机器人的知识壁垒
论文阅读·人工智能·深度学习·算法·机器人
数智工坊20 小时前
【DACS论文阅读】跨域混合采样如何让语义分割模型从合成数据无缝迁移到真实世界
论文阅读·人工智能·算法·机器人·无人机
传说故事21 小时前
【论文阅读】Code as Policies: Language Model Programs for Embodied Control
论文阅读·人工智能·具身智能
Jurio.21 小时前
AI Daily Paper Reader(ADPR):零服务器搭建个人/团队通用大模型API驱动的论文阅读与推荐平台
论文阅读·人工智能·ai
数智工坊1 天前
视觉-语言-动作模型解剖学:从模块、里程碑到核心挑战
论文阅读·人工智能·深度学习·算法·transformer
传说故事2 天前
【论文阅读】RoboAgent: 通过语义增强和动作分块实现机器人操作的泛化与效率
论文阅读·机器人·agent
传说故事2 天前
【论文阅读】Continual Harness: Online Adaptation for Self-Improving Foundation Agents
论文阅读·人工智能·agent
数智工坊2 天前
【FDA论文阅读】: 傅里叶域自适应——零训练成本的语义分割无监督域适配方法
论文阅读·人工智能·学习·算法·自动驾驶