会议笔记:AI Agent 长期记忆(Long-term Memory)分享会
时间:2025 年 5 月 25 日
主题:long term memory for AI agents------ 让 AI Agent 拥有持续上下文与长期记忆
分享人:李老师
一、开场核心认知
本次分享聚焦 AI Agent 记忆(Agent Memory),核心是跨越时间的意图与状态管理系统,是 Agent 基础设施的核心,堪称 "皇冠上的明珠"。
ToC 端 AI 产品中,无记忆 = 45% 用户流失,记忆不是附加功能,而是产品留存的关键。
人类意图天然模糊、不完整,且交互中会不断涌现新想法,无记忆的 Agent 无法支撑长期任务,也难以保持身份、目的一致性。
二、主流产品记忆设计对比(我的视角:不同场景,记忆逻辑天差地别)
- ChatGPT(通用对话类 Agent)
核心需求:记住用户偏好、事实、会话上下文,用户反感重复设置、重建上下文。
记忆分层:
Saved Memory:长期存储用户稳定偏好、事实;
Chat History:管理会话历史,支持分支对话、会话恢复;
合规要求:适配 GDPR 等数据隐私法规,用户可自主管理记忆。
迭代时间线:2024.2 测试版→2024.9 正式上线(付费 / 企业)→2025 年开放用户自主管理。
- Claude Code(代码类 Agent)
核心需求:保障软件工程项目连续性、一致性,避免代码漂移,减少重复读代码库。
记忆设计:聚焦项目规则、技术决策、执行约定,依赖.claudecode.md配置文件(≤200 行)。
迭代特点:2025.4 才正式上线记忆功能,因软件工程场景严谨,迭代更审慎,后续新增 "梦境(dreaming)" 记忆整合功能。
- 小龙虾(开源多端 Agent)
痛点:记忆扁平化、无删改查管理、执行链路长,易丢失关键信息,是用户吐槽核心。
优势:支持移动端操控电脑,适配多端办公,灵活性强。
三、Agent Memory 技术栈(我的视角:记忆是多学科交叉的复杂系统)
三大核心面向:RAG 检索增强、上下文工程、强化学习,不是单一数据库能解决。
核心概念辨析(易混淆):
Memory:最高层级,是 "记忆操作系统";
RAG:数据处理管线,负责检索 + 生成;
向量模型 / 嵌入(Embedding):把文字转数学表征,存入向量库;
提示词工程:与裸模单轮交互;上下文工程:利用大模型上下文窗口承载更多信息;
记忆分类:
语义记忆:存储事实(如 "2025.5.25 分享 Agent 记忆");
情景记忆:记录交互时间、场景;
程序记忆:Agent 自身技能、工作流。
关键工程问题:记忆全生命周期管理(捕获、检索、更新、压缩、丢弃),召回率是核心指标(用户感知 "被记住" 的关键)。
四、我的核心感悟
认知颠覆:原来 Agent 记忆不是简单 "存数据",而是独立的基础设施,直接决定产品生死(用户留存)和长期任务能力。
场景决定设计:对话类 Agent 重 "用户偏好记忆",代码类 Agent 重 "项目规则记忆",开源 Agent 需平衡灵活性与记忆稳定性,无通用记忆方案。
技术复杂性远超预期:记忆是数据库、大模型、强化学习的交叉领域,传统数据库思维会受限,且涉及记忆分类、压缩、召回等工程难题。
用户痛点即方向:用户反感重复、需要稳定上下文,未来做 Agent 相关项目,优先攻克记忆模块,短期记忆可用压缩 / 摘要优化,长期记忆需做分层管理。
行业趋势明确:头部 AI 公司(OpenAI、Anthropic)都在加码记忆能力,记忆工程会是未来 Agent 开发的核心赛道。