Agent 记忆学习笔记-1.1

CoALA 不是 Agent Memory 的起点,而是对已有 Agent Memory 实践的一次系统化抽象和统一。


一、时间线到底是什么?

我们按时间看。


第一阶段:认知科学(1950s~)

最早来源不是 AI。

而是:

Cognitive Science

研究:

text 复制代码
人如何记忆
人如何推理
人如何决策
人如何学习

出现:

Atkinson-Shiffrin Model

1968

提出:

text 复制代码
Sensory Memory

↓

Working Memory

↓

Long-term Memory

这几乎影响了后面所有 Agent Memory 设计。


Tulving

1972

提出:

text 复制代码
Episodic Memory

Semantic Memory

即:

text 复制代码
情景记忆

语义记忆

你现在看到的:

text 复制代码
CoALA

Letta

LangMem

Mem0

基本都在借这个分类。


第二阶段:认知架构(1970s~2010s)

开始尝试:

如何把人的认知过程做成机器。

出现:

ACT-R

Soar

LIDA

这些比 LLM 早几十年。

它们已经拥有:

text 复制代码
Working Memory

Procedural Memory

Semantic Memory

Goal Stack

实际上:

很多 CoALA 图示看起来很新。

但如果你看 Soar:

会发现:

text 复制代码
Goal
Memory
Action
Reflection
Learning

几乎都出现过。


关键结论1

CoALA 并不是第一个提出这些概念的人。

CoALA 最大贡献是:

把经典认知架构翻译成 LLM Agent 时代的语言。


第三阶段:LLM Agent爆发前夜

2022

ChatGPT 出现。

大家发现:

LLM 最大问题:

text 复制代码
没有长期记忆

于是出现第一批方案:

text 复制代码
Vector DB

RAG

Memory Buffer

典型:

LangChain

早期 Memory:

text 复制代码
ConversationBufferMemory

ConversationSummaryMemory

注意:

这个时候还没有 CoALA。


第四阶段:Generative Agents

真正改变行业的是:

Generative Agents

2023

这篇论文的重要程度远超很多人的想象。


为什么重要?

因为它第一次提出:

Agent 记忆不是聊天记录。

而是:

text 复制代码
Observation

↓

Memory

↓

Reflection

↓

Planning

↓

Action

闭环。


论文核心:

Memory Stream

记忆流

text 复制代码
所有经历

Retrieval

检索

按照:

text 复制代码
Recency

Importance

Relevance

评分。


Reflection

反思

自动生成:

text 复制代码
Insight

例如:

text 复制代码
观察:
Tom经常迟到

↓

反思:
Tom缺乏时间观念

这个思想影响巨大。

后来:

Letta

Mem0

LangMem

Auto Memory

全部能看到影子。


关键结论2

如果讨论:

Agent Memory 的直接祖先是谁?

答案通常是:

Generative Agents。

不是 CoALA。


第五阶段:CoALA

CoALA 出现得更晚。

CoALA

2024

它不是发明新 Memory。

而是观察到:

text 复制代码
Generative Agents

AutoGPT

LangChain

MemGPT

ReAct

已经出现大量模式。

于是做了一件事:

分类。


它把 Agent 拆成:

text 复制代码
Memory

Action

Decision Making

三大系统。


Memory 又拆成:

text 复制代码
Working

Semantic

Episodic

Procedural

你会发现:

这其实来自:

text 复制代码
ACT-R

Soar

Tulving

而不是 CoALA 原创。


所以:

CoALA 是地图

不是领土。


第六阶段:工程落地

然后才出现:

Letta

核心:

text 复制代码
Virtual Context

像操作系统。


LangGraph

核心:

text 复制代码
State

Checkpoint

Store

Mem0

核心:

text 复制代码
ADD

UPDATE

DELETE

RETRIEVE

Zep

核心:

text 复制代码
Fact Extraction

Temporal Memory

这些已经属于:

text 复制代码
Memory Engineering

而不是认知理论。


所以谁最核心?

这个问题要分层回答。


如果问理论根源

最核心:

认知科学

代表:

  • Working Memory
  • Episodic Memory
  • Semantic Memory

因为大家都在借鉴这些概念。


如果问 Agent Memory 的直接起点

最核心:

Generative Agents

原因:

它首次证明:

text 复制代码
Memory
+
Reflection
+
Planning

能够让 Agent 长期演化。

这是现代 Agent Memory 的起爆点。


如果问 Agent Memory 的统一理论框架

最核心:

CoALA

因为它提供了:

text 复制代码
Memory

Action

Reasoning

统一分类体系。

类似:

软件工程里的 UML。

不是程序本身。

而是理解程序的地图。

相关推荐
三块可乐两块冰1 小时前
rag笔记4
笔记
问心无愧05131 小时前
ctf show web入门58
前端·笔记
俏皮小混子2 小时前
山东大学软件学院项目实训-创新实训-计科智伴(五)——个人博客(从接口对接到边界问题修复的完整记录)
笔记·学习·状态模式·山东大学
Oll Correct2 小时前
计算机二级WPS Office第十四套WPS演示
笔记·计算机二级wps
AugustRed2 小时前
Flyway 数据库版本迁移 零基础完整学习文档
数据库·学习
我的xiaodoujiao2 小时前
API 接口自动化测试详细图文教程学习系列23--结合Pytest框架使用4-前后置处理
python·学习·测试工具·pytest
USC-XiangLuXun2 小时前
局部科技小创新是有意义的
科技·学习·生活
哇嘎呀2 小时前
OSPF笔记
网络·笔记
Upsy-Daisy2 小时前
IOTA 学习笔记(三):IOTA 的技术演进路线
笔记·学习