Agent 记忆学习笔记-1.1

CoALA 不是 Agent Memory 的起点，而是对已有 Agent Memory 实践的一次系统化抽象和统一。

一、时间线到底是什么？

我们按时间看。

第一阶段：认知科学（1950s~）

最早来源不是 AI。

而是：

Cognitive Science

研究：

text 复制代码

人如何记忆
人如何推理
人如何决策
人如何学习

出现：

Atkinson-Shiffrin Model

1968

提出：

text 复制代码

Sensory Memory

↓

Working Memory

↓

Long-term Memory

这几乎影响了后面所有 Agent Memory 设计。

Tulving

1972

提出：

text 复制代码

Episodic Memory

Semantic Memory

即：

text 复制代码

情景记忆

语义记忆

你现在看到的：

text 复制代码

CoALA

Letta

LangMem

Mem0

基本都在借这个分类。

第二阶段：认知架构（1970s~2010s）

开始尝试：

如何把人的认知过程做成机器。

出现：

ACT-R

Soar

LIDA

这些比 LLM 早几十年。

它们已经拥有：

text 复制代码

Working Memory

Procedural Memory

Semantic Memory

Goal Stack

实际上：

很多 CoALA 图示看起来很新。

但如果你看 Soar：

会发现：

text 复制代码

Goal
Memory
Action
Reflection
Learning

几乎都出现过。

关键结论1

CoALA 并不是第一个提出这些概念的人。

CoALA 最大贡献是：

把经典认知架构翻译成 LLM Agent 时代的语言。

第三阶段：LLM Agent爆发前夜

2022

ChatGPT 出现。

大家发现：

LLM 最大问题：

text 复制代码

没有长期记忆

于是出现第一批方案：

text 复制代码

Vector DB

RAG

Memory Buffer

典型：

LangChain

早期 Memory：

text 复制代码

ConversationBufferMemory

ConversationSummaryMemory

注意：

这个时候还没有 CoALA。

第四阶段：Generative Agents

真正改变行业的是：

Generative Agents

2023

这篇论文的重要程度远超很多人的想象。

为什么重要？

因为它第一次提出：

Agent 记忆不是聊天记录。

而是：

text 复制代码

Observation

↓

Memory

↓

Reflection

↓

Planning

↓

Action

闭环。

论文核心：

Memory Stream

记忆流

text 复制代码

所有经历

Retrieval

检索

按照：

text 复制代码

Recency

Importance

Relevance

评分。

Reflection

反思

自动生成：

text 复制代码

Insight

例如：

text 复制代码

观察：
Tom经常迟到

↓

反思：
Tom缺乏时间观念

这个思想影响巨大。

后来：

Letta

Mem0

LangMem

Auto Memory

全部能看到影子。

关键结论2

如果讨论：

Agent Memory 的直接祖先是谁？

答案通常是：

Generative Agents。

不是 CoALA。

第五阶段：CoALA

CoALA 出现得更晚。

CoALA

2024

它不是发明新 Memory。

而是观察到：

text 复制代码

Generative Agents

AutoGPT

LangChain

MemGPT

ReAct

已经出现大量模式。

于是做了一件事：

分类。

它把 Agent 拆成：

text 复制代码

Memory

Action

Decision Making

三大系统。

Memory 又拆成：

text 复制代码

Working

Semantic

Episodic

Procedural

你会发现：

这其实来自：

text 复制代码

ACT-R

Soar

Tulving

而不是 CoALA 原创。

所以：

CoALA 是地图

不是领土。

第六阶段：工程落地

然后才出现：

Letta

核心：

text 复制代码

Virtual Context

像操作系统。

LangGraph

核心：

text 复制代码

State

Checkpoint

Store

Mem0

核心：

text 复制代码

ADD

UPDATE

DELETE

RETRIEVE

Zep

核心：

text 复制代码

Fact Extraction

Temporal Memory

这些已经属于：

text 复制代码

Memory Engineering

而不是认知理论。

所以谁最核心？

这个问题要分层回答。

如果问理论根源

最核心：

认知科学

代表：

Working Memory
Episodic Memory
Semantic Memory

因为大家都在借鉴这些概念。

如果问 Agent Memory 的直接起点

最核心：

Generative Agents

原因：

它首次证明：

text 复制代码

Memory
+
Reflection
+
Planning

能够让 Agent 长期演化。

这是现代 Agent Memory 的起爆点。

如果问 Agent Memory 的统一理论框架

最核心：

CoALA

因为它提供了：

text 复制代码

Memory

Action

Reasoning

统一分类体系。

类似：

软件工程里的 UML。

不是程序本身。

而是理解程序的地图。