[论文阅读] |智能体长期记忆与反思

写在前面:10月份的时候,联发科天玑9400发布,搭载这款旗舰 5G 智能体 AI 芯片的荣耀MagicOS9.0实现了一句话让手机自动操作美团点咖啡。很快商场实体店里便能看到很多品牌手机已经升级为智能体语音助手。下一步,这些智能体或许便能结合长期交互记忆,挖掘表面行为背后的深层模式(例如偏好)。本文整理前段时间调研的智能体基于长期记忆进行反思的几篇论文。

智能体长期记忆与反思

      • [1. 高层抽取--斯坦福虚拟小镇:智能体角色模拟,基于近期记忆(事件+思考)推理高层思考,形成反思内容](#1. 高层抽取--斯坦福虚拟小镇:智能体角色模拟,基于近期记忆(事件+思考)推理高层思考,形成反思内容)
      • [2. 经验积累--Reflexion【NeurIPS 23】: 聚焦多步骤任务,基于之前轮次任务执行的反馈分析失败原因,将反思出的经验作为长期记忆,存储到情景缓冲区用来指导后续轮次的任务决策](#2. 经验积累--Reflexion【NeurIPS 23】: 聚焦多步骤任务,基于之前轮次任务执行的反馈分析失败原因,将反思出的经验作为长期记忆,存储到情景缓冲区用来指导后续轮次的任务决策)
      • [3. 经验积累-- Ghost in the Minecraft 游戏代理,学习成功的规划对应的具体执行步骤](#3. 经验积累-- Ghost in the Minecraft 游戏代理,学习成功的规划对应的具体执行步骤)
      • [4. 终身学习--Jarvis-1:开放世界下形成多模态记忆(目标+环境+成功执行的计划步骤),并基于经验终身学习提升规划能力](#4. 终身学习--Jarvis-1:开放世界下形成多模态记忆(目标+环境+成功执行的计划步骤),并基于经验终身学习提升规划能力)
      • [5. DiLu(的卢)【ICLR 24】记忆初始化模拟人类驾校考试+记忆存储llm含有数学计算的推理过程](#5. DiLu(的卢)【ICLR 24】记忆初始化模拟人类驾校考试+记忆存储llm含有数学计算的推理过程)
      • [6. MemoChat(腾讯)微调教会智能体识别对话不同主题,存储、并检索记忆](#6. MemoChat(腾讯)微调教会智能体识别对话不同主题,存储、并检索记忆)
      • 总结

1. 高层抽取--斯坦福虚拟小镇:智能体角色模拟,基于近期记忆(事件+思考)推理高层思考,形成反思内容

2. 经验积累--Reflexion【NeurIPS 23】: 聚焦多步骤任务,基于之前轮次任务执行的反馈分析失败原因,将反思出的经验作为长期记忆,存储到情景缓冲区用来指导后续轮次的任务决策

3. 经验积累-- Ghost in the Minecraft 游戏代理,学习成功的规划对应的具体执行步骤

4. 终身学习--Jarvis-1:开放世界下形成多模态记忆(目标+环境+成功执行的计划步骤),并基于经验终身学习提升规划能力

5. DiLu(的卢)【ICLR 24】记忆初始化模拟人类驾校考试+记忆存储llm含有数学计算的推理过程

6. MemoChat(腾讯)微调教会智能体识别对话不同主题,存储、并检索记忆

总结

带着目的找论文
  • 关注发表时间、单位、期刊、是否有落地/代码
  • 阅读摘要和简介里贡献,粗略了解要解决的问题、提出的方法、达到的结果→判断是否符合当前需求、是否继续阅读
    • 不符合则暂时中止
    • 符合则详细了解设计的方法有什么可借鉴之处、实验部分如何评估并带来多大的增益
    • 论文解释不清楚的地方,必要可寻找补充材料和代码(如prompt如何定义反思的概念)
  • 最后整体思考和总结优点、缺点,再次思考可借鉴的地方。
  • 整体扫描结束后,回头整理所有看的论文,输出结论。
相关推荐
张较瘦_11 小时前
[论文阅读] 人工智能 + 软件工程 | 单会话方法论:一种以人类为中心的人工智能辅助软件开发协议
论文阅读·人工智能·软件工程
CV-杨帆1 天前
论文阅读:arxiv 2025 A Survey of Large Language Model Agents for Question Answering
论文阅读·人工智能·语言模型
李加号pluuuus1 天前
【论文阅读】Diffuse and Disperse: Image Generation with Representation Regularization
论文阅读
张较瘦_1 天前
[论文阅读] 人工智能 + 软件工程 | 当LLMs遇上顺序API调用:StateGen与StateEval如何破解测试难题?
论文阅读·人工智能
berling001 天前
【论文阅读 | CVPR 2023 |CDDFuse:基于相关性驱动的双分支特征分解的多模态图像融合】
论文阅读
李加号pluuuus1 天前
【论文阅读】Masked Autoencoders Are Effective Tokenizers for Diffusion Models
论文阅读
berling002 天前
【论文阅读 | IF 2025 | COMO:用于多模态目标检测的跨 Mamba 交互与偏移引导融合】
论文阅读·人工智能·目标检测
张较瘦_2 天前
[论文阅读] 人工智能 + 软件工程 | 开源软件中的GenAI自白:开发者如何用、项目如何管、代码质量受何影响?
论文阅读·人工智能·软件工程
dundunmm3 天前
【论文阅读】A Survey on Knowledge-Oriented Retrieval-Augmented Generation(4)
论文阅读·大模型·llm·rag·检索增强生成·评估标准
CV-杨帆4 天前
论文阅读:arxiv 2025 A Survey on Data Contamination for Large Language Models
论文阅读·人工智能·语言模型