一天一个开源项目(第79篇):生化危机女主角亲自开源的 AI 记忆系统 MemPalace

引言

"她在银幕上打败了病毒变异的僵尸,现在她要解决 AI 的记忆问题。"

这是"一天一个开源项目"系列的第 79 篇。今天的项目是 MemPalaceGitHub)。

先说一个让人意外的背景:这个项目的联合创始人是米拉·乔沃维奇 (Milla Jovovich)------对,就是《生化危机》里的 Alice,《第五元素》里的 Leeloo,那位打遍全系列丧尸的好莱坞动作女星。她没有技术背景,但长期重度使用 AI 工具,对现有记忆解决方案深感沮丧,于是和加密行业 CEO Ben Sigman 一起,主要借助 Claude Code 花了数月时间把这个项目做了出来。

这本身就是一件值得关注的事:一个非工程师,借助 AI 编程工具,做出了一个 AI 基础设施项目

然后是产品本身。LLM 本质上是无状态的------每次开启新会话,你的 AI 助手就像第一次见面,不记得上周商量好的技术方案,不知道你偏好 TypeScript,不了解项目背景。对独立开发者来说,每次重建上下文相当于每月白白损失 200-600 欧元的时间成本。

MemPalace 用一个 2000 年前的认知技术来解决这个问题:记忆宫殿(Method of Loci)。古希腊演说家通过将要记的内容"放置"在想象的建筑空间里来增强记忆。MemPalace 将这套空间隐喻转译为 AI 记忆架构:人和项目是"翼廊"(Wings),具体话题是"房间"(Rooms),原始内容住在"抽屉"(Drawers)里。

48k+ Stars,6.3k+ Forks------发布 48 小时内涨到 22k Stars,是近期最受关注的 AI 工具之一。

你将学到什么

  • 记忆宫殿隐喻如何映射到 AI 记忆架构
  • 4 层渐进式加载:如何用 170 Token 启动完整记忆系统
  • 零 LLM 写路径:彻底消除记忆存储的 API 成本
  • 时序知识图谱:防止过期信息污染记忆
  • MCP 集成:29 个工具如何与 Claude Code 无缝协作
  • 独立评测揭示的争议:哪些宣传存在夸大成分

前置知识

  • 了解 LLM 上下文窗口的基本限制
  • Python 基础(可选)
  • 用过 Claude Code、Cursor 或类似 AI 编程助手(有助于理解应用场景)

项目背景

它是什么?

MemPalace 是一个本地优先的开源 AI 记忆系统,通过 MCP(Model Context Protocol)协议为 AI 助手提供跨会话持久化记忆能力。

核心设计哲学:

vbnet 复制代码
问题:LLM 无状态,每次对话从零开始
          ↓
传统解法:云端记忆服务(Mem0、Zep)
  问题:需要 API Key、数据上云、月费高昂

MemPalace 解法:本地优先
  ✅ 完全离线运行(核心功能无需任何 API Key)
  ✅ 数据留在本地(隐私不上云)
  ✅ 零 LLM 写路径(存储时不调用 AI,零 API 成本)
  ✅ MCP 协议对接主流 AI 助手

关于作者

这个项目有一段颇为有趣的背景:

  • Milla Jovovich:好莱坞女演员,以《第五元素》中的 Leeloo 和《生化危机》系列闻名。非技术背景,但长期重度使用 AI 工具,对现有记忆解决方案感到沮丧,于是发起了这个项目
  • Ben Sigman:加密货币 / 区块链行业 CEO,技术背景开发者

两人花费数月,主要借助 Claude Code 协作开发,大量代码由 AI 辅助生成------这本身就是对"AI 工具能力上限"的一次公开测试。

项目于 2026 年 4 月 5 日首发,最初放在 Milla 的个人账号,随后迁移至 MemPalace 组织账号。

项目数据

  • GitHub Stars: 48,500+(发布 48 小时内涨 22k)
  • 🍴 Forks: 6,300+
  • 📝 Commits: 503+(develop 分支)
  • 📄 协议: MIT
  • 🌐 语言构成: Python 88.9%、HTML 4.6%、CSS 3.1%、Vue 1.4%
  • 📦 PyPI : pip install mempalace

主要功能

核心隐喻:记忆宫殿空间结构

MemPalace 最独特的设计是用空间隐喻来组织 AI 记忆:

markdown 复制代码
记忆宫殿(Palace)
└── 翼廊(Wing)     ← 顶层:一个人 / 一个项目 / 一个主题
    └── 房间(Room) ← 二层:具体话题(如 auth、billing、架构设计)
        └── 走廊(Hall) ← 三层:记忆类型分类
            │    facts(事实)/ events(事件)/ decisions(决策)
            │    preferences(偏好)/ emotional(情感)
            ├── 抽屉(Drawer)  ← 原文逐字存储(800 字符块)
            └── 壁橱(Closet)  ← AAAK 压缩摘要版本

隧道(Tunnel)        ← 跨翼廊连接通路(相同 Room 名的快速导航)

这套组织方式并非单纯的比喻,而是有神经科学依据:Method of Loci 技法会激活海马体的位置细胞系统,帮助人类构建更强的记忆关联。MemPalace 的空间隐喻试图为 AI 提供类似的结构化索引。

4 层渐进式加载:170 Token 启动

这是 MemPalace 最值得关注的工程设计------按需加载,极度节省 Token:

markdown 复制代码
L0:身份文件(约 50-100 Token)
    "我是谁,我在哪个项目上工作"
    ↓(需要更多上下文时)

L1:重要度排名前 15 条记忆(约 500-800 Token)
    最近的决策、关键偏好、重要事实
    ↓(需要深入某个话题时)

L2:当前翼廊/房间范围的语义召回
    当前项目相关的记忆,向量检索
    ↓(需要全局搜索时)

L3:全量语义搜索(无上限)
    跨所有翼廊的全库检索

实际对话启动时,只加载 L0(50-100 Token),AI 助手根据对话需要按需深入------这使得日常对话的记忆成本极低。

零 LLM 写路径:存储不花 API 钱

MemPalace 的记忆写入流程完全不调用 LLM:

python 复制代码
# 传统 AI 记忆系统(有 API 成本):
用户说了什么 → 调用 LLM 提取关键信息 → 存储摘要
                    ↑
                花钱 + 慢 + 依赖网络

# MemPalace 的写路径:
用户内容 → 正则规则 + 关键词评分 → 自动分类到 Wing/Room/Hall
         → 原文切块(800 字符 + 100 字符重叠)→ ChromaDB
            ↑
         完全本地,零 API 调用

项目挖掘(mempalace mine):

bash 复制代码
# 扫描整个项目目录,按规则自动分类记忆
mempalace mine ~/projects/myapp

# 四优先级分类规则:
# 1. 文件夹名(如 auth/ → auth 房间)
# 2. 文件名(如 billing.md → billing 房间)
# 3. 关键词评分(内容关键词匹配)
# 4. 默认放入 general 房间

时序知识图谱:防止过期信息污染

MemPalace 使用 SQLite 存储实体三元组,并附带有效期时间窗口:

sql 复制代码
-- 知识图谱结构
CREATE TABLE knowledge_graph (
    subject TEXT,
    predicate TEXT,
    object TEXT,
    valid_from TEXT,  -- ISO 时间戳
    valid_to TEXT,    -- NULL 表示当前有效
    wing TEXT,
    confidence REAL
);

-- 示例条目:
-- ("项目", "使用语言", "TypeScript", "2026-01-01", NULL, "myapp")
-- ("部署方式", "使用平台", "Vercel", "2026-01-01", "2026-03-15", "myapp")
--  ↑ 已过期,2026-03-15 后不再有效

这避免了一个常见问题:三个月前记录的"项目用 Vercel 部署"在你迁移到 AWS 之后还在污染 AI 的上下文。

29 个 MCP 工具:与 Claude Code 无缝集成

bash 复制代码
# 添加 MCP 服务器到 Claude Code
claude mcp add mempalace -- python -m mempalace.mcp_server

29 个 MCP 工具覆盖:

  • 宫殿导航navigate_to_wingnavigate_to_room、隧道跳转
  • 记忆读写store_memoryretrieve_memorysearch_across_palace
  • 知识图谱add_entityquery_relationshipsupdate_fact
  • 智能体日记:每个 Agent 独立日记本,记录推理过程
  • 自动钩子:session 结束 / pre-compaction 时自动提取并归档关键信息

快速上手

bash 复制代码
# 安装
pip install mempalace

# 初始化项目记忆
mempalace init ~/projects/myapp

# 扫描并导入项目文件
mempalace mine ~/projects/myapp

# 语义搜索
mempalace search "认证方案"

# 生成当前上下文摘要(适合粘贴到 AI 对话开头)
mempalace wake-up > context.txt

# 集成到 Claude Code(MCP)
claude mcp add mempalace -- python -m mempalace.mcp_server

开发环境:

bash 复制代码
git clone https://github.com/MemPalace/mempalace.git
cd mempalace
pip install -e ".[dev]"
pytest tests/ -v

项目详细剖析

整体架构

css 复制代码
┌─────────────────────────────────────────────────────┐
│              MCP 接入层(29 个工具)                 │
│   Claude Code / ChatGPT / Cursor / 任意 MCP 客户端  │
└──────────────────────┬──────────────────────────────┘
                       │
┌──────────────────────▼──────────────────────────────┐
│              记忆编排层(Python)                    │
│  4 层加载控制 / 空间导航 / 自动钩子 / 重要度排序    │
└──────┬────────────────────────────┬─────────────────┘
       │                            │
┌──────▼──────────────┐  ┌──────────▼─────────────────┐
│   向量存储层         │  │    知识图谱层               │
│   ChromaDB           │  │    SQLite                  │
│   Drawers(原文块)  │  │    实体三元组               │
│   语义向量索引       │  │    时序有效期管理           │
└─────────────────────┘  └────────────────────────────┘

AAAK 压缩格式

MemPalace 发明了一种叫 AAAK(Agent Accessible Abbreviated Knowledge)的压缩格式,用于 Closets(壁橱)存储:

css 复制代码
原始文本:
"The authentication module uses JWT tokens with a 24-hour expiration.
 Refresh tokens are stored in Redis with a 30-day TTL."

AAAK 压缩后:
"auth: JWT, 24h exp; rfsh tkn: Redis, 30d TTL"

设计理念:任何 LLM 都能原生读取(不是二进制压缩,而是结构化英文缩写)。团队宣称 30 倍压缩率,但独立评测发现:启用 AAAK 后检索质量下降约 12.4%(55 字符硬截断会丢失语义)。

与竞品的差异化

对比维度 MemPalace Mem0 Zep Hindsight
部署方式 纯本地 仅云端 仅云端 云 + 本地
定价 免费 $249/月(企业版) 付费 免费 + 付费
写路径 LLM 无(零成本)
记忆组织 空间隐喻(宫殿) 扁平摘要 知识图谱 多策略
LongMemEval 分数 96.6%(存疑,见下文) 49.0% 63.8% 91.4%

值得了解的争议

发布后,独立技术分析揭示了若干值得关注的问题,项目团队基本予以承认:

1. 基准测试的误导性 宣传的 96.6% LongMemEval 分数,实际上只测了 ChromaDB 原始 Embedding 能力------宫殿的空间结构完全没参与评测。启用宫殿特性后:

  • 开启 Room 检索:89.4%(下降 7.2 个百分点)
  • 开启 AAAK 压缩:84.2%(下降 12.4 个百分点)

2. "30 倍无损压缩"失实 AAAK 的 55 字符硬截断会丢失句子,Token 计数用 len(text)//3 替代真实 Tokenizer,团队后来公开承认并更新了文档。

3. 部分功能未实现 README 提及的"矛盾检测"在 knowledge_graph.py 中完全没有代码实现;"事实核查"模块存在但未集成进主流程。

为什么仍然值得关注? 这些批评主要针对宣传内容,但核心设计理念是真实有价值的:空间隐喻组织、4 层渐进加载、零 LLM 写路径------这三个设计思路在独立于基准测试数字之外,仍然代表了 AI 记忆架构的一种值得探索的方向。团队在社区质疑后的公开透明态度,也给项目的长期可信度加分。


项目地址与资源

官方资源

技术参考

竞品参考


总结与展望

核心要点

  1. 空间隐喻的真正价值:翼廊/房间/抽屉的层次结构不只是比喻,而是一种真实有效的记忆索引组织方式,降低了用户理解和管理 AI 记忆的认知负担
  2. 4 层渐进加载:以极低的 Token 成本(170 Token)启动,按需深入------这种渐进式设计思路对所有 Agent 记忆系统都有参考价值
  3. 零 LLM 写路径:把存储成本降到零,是本地优先理念的极致体现
  4. 时序知识图谱:有效期机制防止历史信息污染当前上下文,是被低估的实用细节
  5. "AI 辅助构建 AI 工具"的示范意义:由非工程师借助 Claude Code 主导开发,本身就是一次关于 AI 工具能力边界的公开实验
  6. 坦诚的团队态度:面对独立评测揭示的问题,公开承认并修正文档,比许多商业产品更诚实

适合谁使用

  • AI 工具重度用户:每天都在重建上下文的独立开发者和创意工作者
  • 隐私优先用户:不愿意将工作记忆上传云端的个人和团队
  • AI Agent 开发者:需要为 Agent 提供长期记忆基础设施的工程师
  • 研究者:研究 AI 记忆架构、持久化记忆设计模式的学者和工程师

值得思考的问题

MemPalace 提出了一个有趣的问题:AI 记忆的组织单位应该是什么?

Mem0 选择"摘要条目",Zep 选择"知识图谱实体",MemPalace 选择"空间位置"。没有哪种答案是绝对正确的,但选择空间隐喻有一个深刻的隐含假设:人类使用 AI 的方式,越来越像在一个共同的工作空间里长期协作。当 AI 助手开始有了"我们在 auth 房间讨论过这个"的记忆,人机协作的性质就悄然发生了变化。


访问我的个人网站,探索更多实用知识和有趣产品

相关推荐
冬奇Lab2 小时前
Android 开发要变天了:Google 专为 Agent 重建工具链,Token 减少 70%、速度提升 3 倍
android·人工智能·ai编程
慧一居士2 小时前
Open WebUI 和Ollama 区别对比和关系
人工智能
智慧地球(AI·Earth)2 小时前
面向开源生态的高性能大模型 GLM-5.1 发布:技术性能达国际前沿水准
开源
云安全助手2 小时前
2026年AI安全大模型实战指南:快快云安全AI能力全景解析
人工智能·网络安全·claude
fuquxiaoguang2 小时前
当AI开始改写自己的“进化引擎”:从DGM到HyperAgents
人工智能·hyperagents
bKYP953cL2 小时前
构建自己的AI编程助手:基于RAG的上下文感知实现方案
数据库·人工智能·ai编程
数字供应链安全产品选型2 小时前
在供应链攻击激增200%的时代,如何用AI原生安全重塑防御边界?
人工智能
枫叶林FYL2 小时前
项目七:实时异常检测与告警系统——基于统计与机器学习的数据质量监控平台
人工智能·自然语言处理
ZC跨境爬虫3 小时前
3D 地球卫星轨道可视化平台开发 Day7(AI异步加速+卫星系列精简+AI Agent自动评论)
前端·人工智能·3d·html·json