Agent Harness 记忆:发展趋势与未来方向深度研究
核心结论速览
Agent Harness 记忆领域在 2025--2026 年 正经历从"长上下文 + RAG"范式向"分层、可写、可演化的智能体记忆层"的范式跃迁。主流产品已分化为四条相互竞争的架构路径:
| 路径 | 代表产品 | 核心抽象 | 一句话定位 |
|---|---|---|---|
| 分层自编辑记忆 | Letta (MemGPT 继任者) | 内存块 + recall + archival 三层状态 | 由 LLM 自主决定哪些事实进入上下文 |
| 时序知识图谱 | Zep / Graphiti | 双时间 bi-temporal 边失效的 TKG | 处理"事实会过期、会冲突"的动态智能体交互 |
| 记忆控制平面 | Cognee | ECL 管道 + Task DAG | vendor-neutral 横向输出到多 Agent Harness |
| 工具化记忆插件 | Mem0 | function-tool(search/save) | 嵌入 OpenAI Agents SDK / Agno / Google ADK |
六大经验证的核心发现
发现 1 |Letta 的"三层持久化状态"是分层自编辑记忆的范式原型
证据:厂商一手描述(memgpt.ai)、活跃仓库(github.com/letta-ai/letta)、MemGPT 原始论文(Packer et al., ICLR 2024)三方一致。
- in-context 内存块 :以
label / value / limit为字段的显式数据结构;默认persona与human两块,各 5000 字符;LLM 可写、有字符上限、自编辑。 - recall 记忆:自动化的交互历史。
- archival 外部存储:无限容量、语义检索。
- 全部状态以 REST API 暴露,使记忆可观测、可迁移。
发现 2 |Zep/Graphiti 的时序知识图谱解决了"事实会冲突"这一长上下文与 RAG 都解决不了的问题
证据:arXiv 2501.13956《A Temporal Knowledge Graph Architecture for Agent Memory》摘要与 GitHub 仓库(github.com/getzep/graphiti)3 票一致。
- 维护 episodic(情景)与 semantic(语义) 两类记忆。
- 采用 bi-temporal 双时间模型 (
valid_at / expired_at)与边失效机制。 - 相比 RAG 面向静态文档,Zep 面向动态的智能体交互------明确指出 "RAG is limited to static domain knowledge vs agents need dynamic knowledge"。
这是把记忆从"文档检索"提升到"事实演化"的关键架构转折。
发现 3 |Cognee 的 ECL 管道(Extract, Cognify, Load)以显式 Task DAG 公开"取代 RAG"的工程路径
证据:GitHub README、cognee_demo.ipynb、skill.md 一手文档逐字支持,3 票一致。
cognify 阶段是可配置的 Task DAG:
classify → chunk → extract_graph_from_data → summarize_text → add_data_points
- 实体 / 关系 / 本体是一等公民,不是向量检索的副作用。
- 原生支持
temporal_cognify=True。 - 项目已演化为多包 monorepo:
cognee core / frontend / mcp / starter-kit / db-workers / n8n / langchain-cognee。 - 截至 2026-05-31 v1.1.2 已发布,7,794 commits,Apache-2.0,呈现明显的工业化平台特征。
发现 4 |Cognee 自我定位为"Agent 记忆控制平面"并向多个 Harness 横向输出
证据:标语与客户端列举在 README 与官网原文中出现(2 票一致)。
- 同时向 Claude Code、LangGraph、OpenClaw、MCP-compatible 客户端及自定义 runtime 提供跨会话持久化记忆。
- 多后端(Kuzu/Ladybug、Postgres、向量库),具备 vendor-neutral 特征。
- 未独立验证:部分集成(尤其是 OpenClaw 适配器)的工程化深度仅由营销页面支持,缺乏第三方测试证据。
发现 5 |Mem0 走"工具化记忆"路线------以 function-tool 注入主流 Agent 框架
证据:由 Context7 拉取 mem0ai/mem0 三套集成文档(openai-agents-sdk、agno、google-ai-adk),代码示例与 search/save 模式全部一手支持(2 票一致)。
- OpenAI Agents SDK、Agno(提供现成 Mem0Tools)、Google ADK 均通过
@function_tool注入search_memory/save_memory。 - 记忆以工具调用方式显式检索/写入,而非硬耦合长上下文。
- 这种设计意味着记忆层与 Agent 框架是松耦合,便于跨框架迁移。
发现 6 |"2026 年做 AI 搜索 = 做智能体记忆"已成为产业核心论断
证据:三份独立二级来源(腾讯云开发者社区 cloud.tencent.com/developer/article/2679847、Sohu sohu.com/a/1013060467、Jina AI 官方 CSDN blog.csdn.net/Jina_AI/article/details/160421902)在日期(2026-04-18)、地点(北京"Elastic 中国 AI 搜索技术大会")、发言人身份(肖涵,Jina AI 创始人、时任 Elastic 全球副总裁 AI)、核心论断四项上一致,3 票通过。
- 标志着搜索基础设施与 Agent 记忆走向融合------搜索厂商(Elastic、向量库厂商)正在成为记忆底座的关键供给方。
与五个原始问题焦点的对应
1) 主流 Agent Harness(Claude Code / Codex / Cursor / Aider / Cline / Roo Code)的持久化记忆
关键空白 :关于"Claude Code = CLAUDE.md、Cursor = .cursor/rules、Cline/Aider/Roo Code 各自的文件型记忆"这一组在业内被广泛讨论的论断,本轮验证以 0-3 票被反证。这意味着:
- 这些论断目前主要来自二级新闻复盘而非一手产品文档;
- 任何"X harness 用 Y 文件做记忆"的具体细节,需直接查阅各 harness 官方文档而非依赖二手叙述。
2) 业界出现的记忆架构模式
已证实的四种模式对应四大产品(见上表);其他被广泛讨论的模式------如"分层记忆中的 L1/L2/L3 显式层级"、"工作记忆 / 情景记忆 / 语义记忆 / 程序性记忆的多类型分类"
3) 与长上下文 / tool use / sub-agent 编排的协同演进
已证实:搜索基础设施正在成为 Agent 记忆的关键底座 (发现 6)。
未证实:具体厂商如何把"长上下文窗口"与"记忆层"在 sub-agent 编排中协同(例如 Letta 是否为 sub-agent 维护独立 archival),本轮未找到一手证据。
4) 开源生态与学术研究的关键项目与论文
经一手验证的开源/学术核心:
- Letta / MemGPT(github.com/letta-ai/letta + MemGPT 论文 ICLR 2024)
- Zep/Graphiti(arxiv.org/abs/2501.13956)
- Cognee(github.com/topoteretes/cognee, 7,794 commits, v1.1.2)
- Mem0(github.com/mem0ai/mem0)
5) 未来 1--3 年有前景的技术方向与开放问题
由工作流在 4 个未关闭的问题中识别:
Q1 跨 Harness 的可移植记忆标准 --- 现状是各 harness 各自管理文件型记忆(CLAUDE.md、.cursor/rules),Letta/Cognee/Zep/Mem0 又各提供外部记忆层;未来是否会收敛为统一的 MCP-style 记忆接口或事实交换标准,是 1--3 年内最值得关注的演进方向。
Q2 遗忘/失效机制的标准化 --- Letta 的 archival 不可变、Zep 的边失效、Mem0 的 delete API、Cognee 的 forget() 各自定义不同。GDPR 与隐私合规背景下,**"该忘的能不能忘掉"**是工程化落地的核心开放问题。
Q3 大规模记忆评测基准(1M--10M token) --- BEAM、LongMemEval、LoCoMo 等基准尚未被独立第三方广泛复现,各厂商自报分数的外部效度无法判定。
Q4 时序知识图谱的可扩展性 --- Zep/Graphiti 的双时间模型在小规模已验证;当 entity/edge 增长到亿级时,推理时延、增量更新、跨图合并仍是未充分研究的工程问题;这与"亚秒级响应"的 Agent 实时性需求存在张力。
时间敏感性与引用须知
| 维度 | 状态 |
|---|---|
| 主体事实(Letta 架构、Zep/Graphiti、Cognee v1.1.2) | 截至 2026-05-31 仍属"当前"信息 |
| Agent Memory 赛道产品更迭 | 极快(腾讯云报道"几乎每周都有新玩家") |
| 6 个月以上的具体厂商对比 | 可能已过时 |
| Mem0 性能数字(BEAM 分数) | 未通过验证,不要在生产基准比较中引用 |
| "X harness 用 Y 文件做记忆" | 本轮未独立验证,请回溯各 harness 官方文档 |
| 肖涵演讲原幻灯片 | 需向 Elastic 官方索取,本报告基于三份二级新闻复盘 |
一句话总结
2025--2026 的 Agent Harness 记忆正从"长上下文 + RAG"走向"分层、可写、可演化"的四类架构竞争;未来 1--3 年的胜负,取决于谁能先把"事实会过期"做成 TKG 的边失效、谁能先把"该忘的能忘掉"做成合规的删除语义、谁能先把跨 Harness 的记忆接口做成事实标准。
附:来源索引(按质量等级)
一手来源(primary)
- https://memgpt.ai/ --- Letta/MemGPT 官方
- https://github.com/letta-ai/letta --- Letta 主仓库
- https://arxiv.org/abs/2501.13956 --- Zep/Graphiti 论文
- https://github.com/getzep/graphiti --- Graphiti 主仓库
- https://github.com/mem0ai/mem0 --- Mem0 主仓库
- https://github.com/topoteretes/cognee --- Cognee 主仓库
- https://cognee.ai/ --- Cognee 官网
二级来源(blog)
- https://cloud.tencent.com/developer/article/2679847 --- 腾讯云开发者社区(肖涵演讲复盘)
- https://www.sohu.com/a/1013060467_121423427 --- Sohu 同主题复盘
- https://blog.csdn.net/Jina_AI/article/details/160421902 --- Jina AI 官方 CSDN 复盘
引用规范
- 学术引用:MemGPT 论文使用 Packer et al., ICLR 2024 原引用。
- 时序知识图谱引用:arXiv:2501.13956《A Temporal Knowledge Graph Architecture for Agent Memory》。
- 行业论断引用:肖涵 2026-04-18 北京"Elastic 中国 AI 搜索技术大会"主旨演讲(三份独立二级新闻复盘支持)。