Agent 记忆学习笔记-1.1

CoALA 不是 Agent Memory 的起点,而是对已有 Agent Memory 实践的一次系统化抽象和统一。


一、时间线到底是什么?

我们按时间看。


第一阶段:认知科学(1950s~)

最早来源不是 AI。

而是:

Cognitive Science

研究:

text 复制代码
人如何记忆
人如何推理
人如何决策
人如何学习

出现:

Atkinson-Shiffrin Model

1968

提出:

text 复制代码
Sensory Memory

↓

Working Memory

↓

Long-term Memory

这几乎影响了后面所有 Agent Memory 设计。


Tulving

1972

提出:

text 复制代码
Episodic Memory

Semantic Memory

即:

text 复制代码
情景记忆

语义记忆

你现在看到的:

text 复制代码
CoALA

Letta

LangMem

Mem0

基本都在借这个分类。


第二阶段:认知架构(1970s~2010s)

开始尝试:

如何把人的认知过程做成机器。

出现:

ACT-R

Soar

LIDA

这些比 LLM 早几十年。

它们已经拥有:

text 复制代码
Working Memory

Procedural Memory

Semantic Memory

Goal Stack

实际上:

很多 CoALA 图示看起来很新。

但如果你看 Soar:

会发现:

text 复制代码
Goal
Memory
Action
Reflection
Learning

几乎都出现过。


关键结论1

CoALA 并不是第一个提出这些概念的人。

CoALA 最大贡献是:

把经典认知架构翻译成 LLM Agent 时代的语言。


第三阶段:LLM Agent爆发前夜

2022

ChatGPT 出现。

大家发现:

LLM 最大问题:

text 复制代码
没有长期记忆

于是出现第一批方案:

text 复制代码
Vector DB

RAG

Memory Buffer

典型:

LangChain

早期 Memory:

text 复制代码
ConversationBufferMemory

ConversationSummaryMemory

注意:

这个时候还没有 CoALA。


第四阶段:Generative Agents

真正改变行业的是:

Generative Agents

2023

这篇论文的重要程度远超很多人的想象。


为什么重要?

因为它第一次提出:

Agent 记忆不是聊天记录。

而是:

text 复制代码
Observation

↓

Memory

↓

Reflection

↓

Planning

↓

Action

闭环。


论文核心:

Memory Stream

记忆流

text 复制代码
所有经历

Retrieval

检索

按照:

text 复制代码
Recency

Importance

Relevance

评分。


Reflection

反思

自动生成:

text 复制代码
Insight

例如:

text 复制代码
观察:
Tom经常迟到

↓

反思:
Tom缺乏时间观念

这个思想影响巨大。

后来:

Letta

Mem0

LangMem

Auto Memory

全部能看到影子。


关键结论2

如果讨论:

Agent Memory 的直接祖先是谁?

答案通常是:

Generative Agents。

不是 CoALA。


第五阶段:CoALA

CoALA 出现得更晚。

CoALA

2024

它不是发明新 Memory。

而是观察到:

text 复制代码
Generative Agents

AutoGPT

LangChain

MemGPT

ReAct

已经出现大量模式。

于是做了一件事:

分类。


它把 Agent 拆成:

text 复制代码
Memory

Action

Decision Making

三大系统。


Memory 又拆成:

text 复制代码
Working

Semantic

Episodic

Procedural

你会发现:

这其实来自:

text 复制代码
ACT-R

Soar

Tulving

而不是 CoALA 原创。


所以:

CoALA 是地图

不是领土。


第六阶段:工程落地

然后才出现:

Letta

核心:

text 复制代码
Virtual Context

像操作系统。


LangGraph

核心:

text 复制代码
State

Checkpoint

Store

Mem0

核心:

text 复制代码
ADD

UPDATE

DELETE

RETRIEVE

Zep

核心:

text 复制代码
Fact Extraction

Temporal Memory

这些已经属于:

text 复制代码
Memory Engineering

而不是认知理论。


所以谁最核心?

这个问题要分层回答。


如果问理论根源

最核心:

认知科学

代表:

  • Working Memory
  • Episodic Memory
  • Semantic Memory

因为大家都在借鉴这些概念。


如果问 Agent Memory 的直接起点

最核心:

Generative Agents

原因:

它首次证明:

text 复制代码
Memory
+
Reflection
+
Planning

能够让 Agent 长期演化。

这是现代 Agent Memory 的起爆点。


如果问 Agent Memory 的统一理论框架

最核心:

CoALA

因为它提供了:

text 复制代码
Memory

Action

Reasoning

统一分类体系。

类似:

软件工程里的 UML。

不是程序本身。

而是理解程序的地图。

相关推荐
通信小呆呆4 天前
当算法有了“五感”:多模态数据融合如何向人体感官协同学习?
人工智能·学习·算法·机器学习·机器人
H__Rick4 天前
自动对焦学习-3
人工智能·学习·计算机视觉
Daisy Lee4 天前
量化学习-第1章-什么是量化金融
学习·金融·datawhale
Alsn864 天前
等待学习-学习目录:Docker 容器安全攻防
学习·安全·docker
YM52e4 天前
买菜计算器小应用 - HarmonyOS ArkUI 开发实战-PC版本
学习·华为·harmonyos·鸿蒙·鸿蒙系统
小雨下雨的雨4 天前
HarmonyOS ArkUI训练营入门-组件掌握系列-Animation 动画效果实现-PC版本
学习·华为·harmonyos·鸿蒙
闪闪发亮的小星星4 天前
高斯光以及高斯光公式解释
笔记
cqbzcsq4 天前
CellFlow虚拟细胞论文阅读
论文阅读·人工智能·笔记·学习·生物信息
YangYang9YangYan4 天前
2026初入职场学习数据分析的价值
学习·数据挖掘·数据分析
阿米亚波4 天前
【Windows】QEMU 启动 openEuler aarch64/arm64 架构系统 + 离线软件源
linux·windows·经验分享·笔记·架构·arm