如果你正在构建AI代理,大概率已经尝试过添加"记忆"------RAG、长上下文处理、向量存储,或是摘要缓冲区,但仍会遇到代理行为漂移、重复错误或忘记关键信息的问题。
这并非技术选型不当,而是我们常将记忆视为单一功能模块,却忽略了它本质是一个完整系统:包含不同的表示形式、特定的功能定位,以及需要明确规则的生命周期管理(而非单纯的存储)。
论文《Memory in the Age of AI Agents: A Survey》(胡等人,arXiv:2512.13564, 2025)为混乱的记忆设计带来了清晰的概念框架。它跳出传统"短期/长期记忆"的粗糙分类,从"形式、功能、动态"三个维度构建了记忆系统的架构图。本文将结合这份权威研究,为你提供可直接落地的AI代理记忆设计指南。
一、先厘清:代理记忆≠RAG≠长上下文
记忆设计的混淆,往往源于将四个不同概念混为一谈。明确它们的边界,是构建有效记忆系统的前提:
| 概念 | 核心定位 | 评估标准 |
|---|---|---|
| RAG | 查询时获取外部知识 | 检索准确率、召回率 |
| 上下文工程 | 优化提示/格式/工具使用 | 模型即时响应质量 |
| LLM记忆 | 模型内部状态管理(注意力/KV缓存等) | 长序列处理效率 |
| 代理记忆 | 持久化、自我进化的认知状态 | 长期适应性、行为一致性 |
代理记忆与其他概念存在重叠,但核心差异在于其持久化和进化能力 ------它不仅存储信息,更要支撑代理在长期交互中积累经验、适应环境,而非局限于单次查询或对话。
论文提出的三维框架,彻底打破了"短期/长期"的二元分类,为记忆设计提供了清晰的坐标:
- 形式(Forms):记忆的表示方式
- 功能(Functions):记忆的核心用途
- 动态(Dynamics):记忆的生命周期管理

二、记忆的构成:四种表示形式及取舍
代理记忆的表示形式决定了其存储效率、可解释性和使用成本。实际设计中,通常是多种形式的组合使用:
1. 上下文记忆(In-context)
直接利用LLM的上下文窗口存储信息,无需额外存储组件。
- 优点:集成简单、响应迅速,无需额外检索开销
- 缺点:受上下文长度限制,成本高,易因对话演进导致信息漂移
2. 外部记忆(External)
存储在模型外部的独立组件(向量数据库、知识图谱等)。
- 优点:存储容量大、可独立维护,支持灵活查询
- 缺点:需构建完整检索子系统,性能依赖分块、嵌入、排序和查询构建质量
3. 参数记忆(Parametric)
存储在模型权重或附加模块(如LoRA)中,通过参数更新固化信息。
- 优点:调用 latency 低,与模型推理深度融合
- 缺点:调试困难,存在知识干扰风险,更新成本高
4. 潜在记忆(Latent)
以隐藏状态、KV缓存或学习型压缩表示的形式存在,非人类可读。
- 优点:存储效率高,支持多模态融合,不占用文本上下文空间
- 缺点:可解释性差,难以手动编辑和验证
潜在记忆主要通过三种模式运作:生成(产生新的潜在状态)、重用(延续历史计算状态)、转换(压缩/重塑状态以提升效率),适用于对延迟敏感且可接受一定黑盒特性的场景。

三、记忆的核心功能:三大支柱缺一不可
许多代理记忆失效,是因为只实现了单一功能。论文指出,完整的记忆系统需支撑三个核心功能,分别对应代理的"身份一致性、能力进化、即时认知":
1. 事实记忆(Factual Memory):"代理知道什么?"
- 定位:存储稳定的声明性知识,是代理行为一致性的基础
- 核心内容:用户偏好、任务约束、环境状态、长期事实(如用户身份、系统规则)
- 价值:避免重复询问、保持人设统一,确保决策符合已知约束
2. 经验记忆(Experiential Memory):"代理如何改进?"
- 定位:从交互轨迹中提炼的程序性知识,是代理自我进化的核心
- 核心内容:成功案例、失败教训、问题解决策略、工具使用技巧、跨任务启发式
- 价值:让代理越用越熟练,无需人工持续编写规则
3. 工作记忆(Working Memory):"代理现在在想什么?"
- 定位:任务执行期间的临时认知缓冲区,支撑即时推理
- 核心内容:子目标、中间结果、工具输出、当前假设、未完成步骤
- 价值:避免认知过载,确保长流程任务的逻辑连贯性
实用心智模型:事实记忆保障"身份稳定",经验记忆支撑"能力成长",工作记忆维持"当前专注"。如果你的代理出现行为混乱,大概率是缺少了某类功能------多数初级记忆实现仅覆盖事实记忆,却忽略了经验和工作记忆的构建。
四、记忆的生命周期:从存储到进化的完整闭环
记忆不是静态数据库,而是动态进化的系统。论文将其形式化为三个核心操作,共同构成记忆的生命周期:
1. 记忆形成(Formation):筛选有价值的信息
从原始交互数据(对话、工具输出、环境反馈)中,提取值得长期保留的内容,而非全盘存储。
- 关键操作:总结核心观点、提炼关键技巧、结构化整理(如转化为知识图谱三元组)
- 核心目标:去噪、浓缩,确保记忆内容的高价值密度
2. 记忆进化(Evolution):保持记忆的有效性
随着新信息的加入,动态优化记忆库,避免冗余和冲突。
- 关键操作:
- 巩固:合并相似信息(如多次提到的用户偏好)
- 更新:修正错误信息、补充新增细节
- 遗忘:删除过时、低价值内容(如临时任务的中间数据)
- 核心目标:维持记忆的一致性、简洁性和时效性
3. 记忆检索(Retrieval):精准调用关键信息
根据当前任务需求,高效提取相关记忆并集成到推理过程中。
- 关键操作:构建任务相关查询、过滤噪音、格式化输出(适配模型输入)
- 核心目标:确保检索结果的相关性和可用性

一个关键洞察:"短期/长期"并非记忆的固有属性,而是由使用模式决定的。同一记忆基板,通过不同的形成、进化、检索策略,可以同时承担短期和长期记忆的角色。
五、落地实践:本周构建代理记忆的行动清单
结合论文框架和工程实践,以下清单可直接指导记忆系统设计:
1. 先定功能,再选存储
- 明确核心目标:是优先保障身份一致(侧重事实记忆)、让代理成长(侧重经验记忆),还是支撑复杂任务(侧重工作记忆)?
- 避免"为了存储而存储":所有存储操作都应对应明确的功能需求
2. 必须定义记忆进化规则
- 冗余处理:如何识别并合并重复信息?
- 冲突解决:当新信息与既有记忆矛盾时,以什么规则判定优先级?
- 遗忘策略:基于时间、访问频率还是信息价值评分删除内容?
- 没有进化规则的记忆,最终会因冗余和冲突导致代理行为降级
3. 针对长期场景评估记忆效果
- 测试维度:第30回合是否仍能记住关键事实?跨任务场景是否能复用经验?
- 避免"短期有效"的误区:仅在少数回合内起作用的记忆系统,无法支撑实用代理
4. 将记忆视为安全攻击面
- 风险防范:如何避免记忆被污染、敏感信息泄露?
- 可追溯性:关键决策对应的记忆来源是否可查?
- 记忆的持久性意味着错误和风险也会被持久化,需提前设防
六、未来趋势:强化学习驱动的智能记忆
论文最具前瞻性的观点是:记忆策略将从"手动设计"走向"自主学习"。目前已有研究探索用强化学习优化记忆的存储、更新和检索策略,而非依赖固定启发式规则。

即使当下不采用强化学习,也应在设计时预留扩展空间------未来的"记忆管理器"很可能成为一个可训练组件,通过与环境的交互持续优化记忆策略。
结语
AI代理的可靠性,本质上取决于记忆系统的完善度。从将记忆视为"存储容器",到理解其是"包含形式、功能、动态的完整系统",是构建实用级AI代理的关键一步。
遵循"先定功能、再选形式、定义动态规则"的思路,结合论文提出的三维框架,你可以避开多数常见陷阱,打造出真正支撑代理长期稳定运行的记忆系统。随着技术演进,记忆将不再是被动的信息仓库,而是主动驱动代理进化的核心认知组件。