2026 AI x Web3 School共学营笔记-Day7

会议笔记:AI Agent 长期记忆(Long-term Memory)分享会

时间:2025 年 5 月 25 日

主题:long term memory for AI agents------ 让 AI Agent 拥有持续上下文与长期记忆

分享人:李老师

一、开场核心认知

本次分享聚焦 AI Agent 记忆(Agent Memory),核心是跨越时间的意图与状态管理系统,是 Agent 基础设施的核心,堪称 "皇冠上的明珠"。

ToC 端 AI 产品中,无记忆 = 45% 用户流失,记忆不是附加功能,而是产品留存的关键。

人类意图天然模糊、不完整,且交互中会不断涌现新想法,无记忆的 Agent 无法支撑长期任务,也难以保持身份、目的一致性。

二、主流产品记忆设计对比(我的视角:不同场景,记忆逻辑天差地别)

  1. ChatGPT(通用对话类 Agent)

核心需求:记住用户偏好、事实、会话上下文,用户反感重复设置、重建上下文。

记忆分层:

Saved Memory:长期存储用户稳定偏好、事实;

Chat History:管理会话历史,支持分支对话、会话恢复;

合规要求:适配 GDPR 等数据隐私法规,用户可自主管理记忆。

迭代时间线:2024.2 测试版→2024.9 正式上线(付费 / 企业)→2025 年开放用户自主管理。

  1. Claude Code(代码类 Agent)

核心需求:保障软件工程项目连续性、一致性,避免代码漂移,减少重复读代码库。

记忆设计:聚焦项目规则、技术决策、执行约定,依赖.claudecode.md配置文件(≤200 行)。

迭代特点:2025.4 才正式上线记忆功能,因软件工程场景严谨,迭代更审慎,后续新增 "梦境(dreaming)" 记忆整合功能。

  1. 小龙虾(开源多端 Agent)

痛点:记忆扁平化、无删改查管理、执行链路长,易丢失关键信息,是用户吐槽核心。

优势:支持移动端操控电脑,适配多端办公,灵活性强。

三、Agent Memory 技术栈(我的视角:记忆是多学科交叉的复杂系统)

三大核心面向:RAG 检索增强、上下文工程、强化学习,不是单一数据库能解决。

核心概念辨析(易混淆):

Memory:最高层级,是 "记忆操作系统";

RAG:数据处理管线,负责检索 + 生成;

向量模型 / 嵌入(Embedding):把文字转数学表征,存入向量库;

提示词工程:与裸模单轮交互;上下文工程:利用大模型上下文窗口承载更多信息;

记忆分类:

语义记忆:存储事实(如 "2025.5.25 分享 Agent 记忆");

情景记忆:记录交互时间、场景;

程序记忆:Agent 自身技能、工作流。

关键工程问题:记忆全生命周期管理(捕获、检索、更新、压缩、丢弃),召回率是核心指标(用户感知 "被记住" 的关键)。

四、我的核心感悟

认知颠覆:原来 Agent 记忆不是简单 "存数据",而是独立的基础设施,直接决定产品生死(用户留存)和长期任务能力。

场景决定设计:对话类 Agent 重 "用户偏好记忆",代码类 Agent 重 "项目规则记忆",开源 Agent 需平衡灵活性与记忆稳定性,无通用记忆方案。

技术复杂性远超预期:记忆是数据库、大模型、强化学习的交叉领域,传统数据库思维会受限,且涉及记忆分类、压缩、召回等工程难题。

用户痛点即方向:用户反感重复、需要稳定上下文,未来做 Agent 相关项目,优先攻克记忆模块,短期记忆可用压缩 / 摘要优化,长期记忆需做分层管理。

行业趋势明确:头部 AI 公司(OpenAI、Anthropic)都在加码记忆能力,记忆工程会是未来 Agent 开发的核心赛道。

相关推荐
lizhihai_992 小时前
股市学习心得-AI 产业链核心标的梳理清单
大数据·服务器·人工智能·科技·学习
暮雪倾风2 小时前
【AI】国内使用Claude Code,配置Claude Code,使用DeepSeek为例
人工智能
FrameNotWork2 小时前
HarmonyOS6.1 AI 模型管理架构设计与最佳实践
人工智能·harmonyos
没事别瞎琢磨2 小时前
十、统一 Runner 入口——能力检测与模式回退
人工智能·node.js
装不满的克莱因瓶2 小时前
了解 LangChain 中的 LLM 与 ChatModel 的差异
人工智能·python·ai·langchain·llm·agent·chatmodel
dingzd952 小时前
跨境社媒运营越到后面 越比拼账号的表达稳定性
大数据·人工智能·矩阵·内容营销
云烟成雨TD2 小时前
Spring AI 1.x 系列【54】Retry 机制分析
java·人工智能·spring
没事别瞎琢磨2 小时前
八、环境隔离——构建安全的子进程环境
人工智能·node.js
手写码匠2 小时前
从零实现 Prompt 工程引擎:结构化提示、自动优化与多轮自省体系
人工智能·深度学习·算法·aigc
甲维斯2 小时前
Claude Fable5首测,GPT5.5和国产模型弱爆了!
人工智能