CoALA 不是 Agent Memory 的起点,而是对已有 Agent Memory 实践的一次系统化抽象和统一。
一、时间线到底是什么?
我们按时间看。
第一阶段:认知科学(1950s~)
最早来源不是 AI。
而是:
Cognitive Science
研究:
text
人如何记忆
人如何推理
人如何决策
人如何学习
出现:
Atkinson-Shiffrin Model
1968
提出:
text
Sensory Memory
↓
Working Memory
↓
Long-term Memory
这几乎影响了后面所有 Agent Memory 设计。
Tulving
1972
提出:
text
Episodic Memory
Semantic Memory
即:
text
情景记忆
语义记忆
你现在看到的:
text
CoALA
Letta
LangMem
Mem0
基本都在借这个分类。
第二阶段:认知架构(1970s~2010s)
开始尝试:
如何把人的认知过程做成机器。
出现:
ACT-R
Soar
LIDA
这些比 LLM 早几十年。
它们已经拥有:
text
Working Memory
Procedural Memory
Semantic Memory
Goal Stack
实际上:
很多 CoALA 图示看起来很新。
但如果你看 Soar:
会发现:
text
Goal
Memory
Action
Reflection
Learning
几乎都出现过。
关键结论1
CoALA 并不是第一个提出这些概念的人。
CoALA 最大贡献是:
把经典认知架构翻译成 LLM Agent 时代的语言。
第三阶段:LLM Agent爆发前夜
2022
ChatGPT 出现。
大家发现:
LLM 最大问题:
text
没有长期记忆
于是出现第一批方案:
text
Vector DB
RAG
Memory Buffer
典型:
LangChain
早期 Memory:
text
ConversationBufferMemory
ConversationSummaryMemory
注意:
这个时候还没有 CoALA。
第四阶段:Generative Agents
真正改变行业的是:
Generative Agents
2023
这篇论文的重要程度远超很多人的想象。
为什么重要?
因为它第一次提出:
Agent 记忆不是聊天记录。
而是:
text
Observation
↓
Memory
↓
Reflection
↓
Planning
↓
Action
闭环。
论文核心:
Memory Stream
记忆流
text
所有经历
Retrieval
检索
按照:
text
Recency
Importance
Relevance
评分。
Reflection
反思
自动生成:
text
Insight
例如:
text
观察:
Tom经常迟到
↓
反思:
Tom缺乏时间观念
这个思想影响巨大。
后来:
Letta
Mem0
LangMem
Auto Memory
全部能看到影子。
关键结论2
如果讨论:
Agent Memory 的直接祖先是谁?
答案通常是:
Generative Agents。
不是 CoALA。
第五阶段:CoALA
CoALA 出现得更晚。
CoALA
2024
它不是发明新 Memory。
而是观察到:
text
Generative Agents
AutoGPT
LangChain
MemGPT
ReAct
已经出现大量模式。
于是做了一件事:
分类。
它把 Agent 拆成:
text
Memory
Action
Decision Making
三大系统。
Memory 又拆成:
text
Working
Semantic
Episodic
Procedural
你会发现:
这其实来自:
text
ACT-R
Soar
Tulving
而不是 CoALA 原创。
所以:
CoALA 是地图
不是领土。
第六阶段:工程落地
然后才出现:
Letta
核心:
text
Virtual Context
像操作系统。
LangGraph
核心:
text
State
Checkpoint
Store
Mem0
核心:
text
ADD
UPDATE
DELETE
RETRIEVE
Zep
核心:
text
Fact Extraction
Temporal Memory
这些已经属于:
text
Memory Engineering
而不是认知理论。
所以谁最核心?
这个问题要分层回答。
如果问理论根源
最核心:
认知科学
代表:
- Working Memory
- Episodic Memory
- Semantic Memory
因为大家都在借鉴这些概念。
如果问 Agent Memory 的直接起点
最核心:
Generative Agents
原因:
它首次证明:
text
Memory
+
Reflection
+
Planning
能够让 Agent 长期演化。
这是现代 Agent Memory 的起爆点。
如果问 Agent Memory 的统一理论框架
最核心:
CoALA
因为它提供了:
text
Memory
Action
Reasoning
统一分类体系。
类似:
软件工程里的 UML。
不是程序本身。
而是理解程序的地图。