MemOS OpenClaw 插件测评结果来啦！Tokens 消耗降低 72%+

OpenClaw 原生架构的记忆依赖上下文历史拼接、工具调用读写本地文件，以及显式对话指令触发记忆。

这带来几个问题：

检索算法简陋： 召回不稳定、相关性弱，Agent 需要反复试错与重问，Token 随对话轮次快速累积。
上下文注入过量： 每次执行固定读取近两天全量记忆（today + yesterday）+ 长期记忆，缺乏按任务裁剪，导致无效上下文占比高。
记忆缺少结构与去冗余： 工具调用的长输出（如 find 遍历、config.schema 等）被直接写入并在后续反复重传，成本呈滚雪球式放大。

最严重的是上下文爆炸，文件读写加上工具调用日志进入 prompt，导致 token 非线性增长。

原生 OpenClaw 本质是 Prompt 驱动型 Agent，记忆等于上下文，状态等于 token，长期能力等于上下文堆叠。而 OpenClaw + MemOS 转变为系统驱动型 Agent，记忆是系统层，状态是结构化存储，推理是状态调度加模型调用，Agent 从"会聊天的程序"转向"具备长期状态连续性的智能系统组件"。

本次测试，我们用公开数据集和真实任务对 OpenClaw 原生方案和 OpenClaw + MemOS 插件两个方案，对长期记忆能力、跨会话一致性、token 消耗与系统效率进行系统对比评测。

公开数据集测试（LOCOMO）

数据集说明

通过 LOCOMO（Long-Term Conversational Memory Benchmark），测试两类任务：

问答任务测精确召回能力，
事件摘要测长期语义整合能力。

评测通过 Gateway 启动两个 OpenClaw 端点版本：原生 OpenClaw、集成 MemOS 插件的 OpenClaw。

测试流程：

将数据集中的文本对话输入 OpenClaw，
再以数据集中的问题作为 query 进行提问，
对返回结果进行准确率评估，
并通过底层模型日志统计 token 使用量，从而同时评估记忆效果与系统成本。

全量测试结果

准确性方面，准确率从 0.2373 提升到 0.3168，说明长期对话的记忆稳定性明显增强。Agent 不再只靠上下文拼接做短期推理，而是有了结构化记忆调度能力。

成本方面，模型调用次数降低 59.5%，token 消耗降低 72%+。系统不再通过"堆 prompt"维持状态，而是通过记忆系统做状态抽取、结构化存储和按需激活。这是个重要转变：从"上下文记忆"到"系统记忆"。

真实任务测试（工程场景）

公开数据集只能验证模型能力上限，真实系统更关心工程行为：跨会话连续任务、复杂状态保持、长期协作交互。

我们构建了一组复杂真实任务流，测试跨会话任务连续性、多维度信息检索稳定性、记忆写入与召回效率，以及 token 成本随复杂度的增长趋势。

MemOS OpenClaw Plugin 通过自动记忆机制，让 Agent 的所有交互进入记忆系统，形成结构化存储和可调度状态。

工程实测对比

跨会话任务测试

集成 MemOS 后，对话轮次减少约 53%，token 消耗减少约 49%。

跨会话任务可以自然延续，无需用户反复重建上下文。不再出现"行为反转"、"偏好丢失"、"任务方向漂移"这些问题。

Agent 从"短期记忆型对话工具"转变为"具备长期状态连续性的协作系统"。

单会话记忆读写效率测试

在 OpenClaw 原生架构中，记忆读写依赖工具调用，本地文件操作产生大量不可控上下文污染，一次"写一句话"的操作能引入数千 token 的上下文膨胀。

MemOS 将记忆从"prompt 负担"转为"系统状态层"，记忆不进入上下文堆叠而是按需激活注入，状态与对话解耦，记忆与推理解耦，从架构上阻断了 token 爆炸路径。

从工具到落地

Token 成本可控：从"全量灌上下文"变成"按任务精确召回"

OpenClaw 不再每次固定塞入 today+yesterday+ 长期记忆，而是由 MemOS 按当前任务检索最相关的少量记忆（可设定召回预算/条数），显著降低无效上下文占比，避免 Token 滚雪球。

检索更稳更准：减少反复试错与重问，提升一次命中率

MemOS 提供更强的记忆组织与检索能力（结构化、分层/多粒度、语义检索 + 规则过滤等），让 OpenClaw 召回的内容相关性更强、稳定性更高，减少 Agent 因"召回不稳"导致的重复推理与反复确认。

记忆更干净可用：结构化 + 去冗余 + 高压缩，避免"长输出污染"

工具调用的长输出（如遍历结果、config/schema 等）不会直接原样反复写入上下文；MemOS 可以做摘要/压缩、去重与归档，长期运行越用越"清爽"，记忆质量随时间提升而不是劣化。

在真实工程环境中，这带来可扩展性提升、token 成本可控、跨会话能力稳定、长期任务可持续，以及 Agent 行为一致性增强。

记忆不再是 prompt 技巧，而是系统架构能力。

立即体验

🦞 Your lobster now has a working memory system.

Get your API key:

memos-dashboard.openmem.net/quickstart/...

Try it: Full tutorial

github.com/MemTensor/M...

关于 MemOS

MemOS 为 AI 应用构建统一的记忆管理平台，让智能系统如大脑般拥有灵活、可迁移、可共享的长期记忆和即时记忆。

作为记忆张量首次提出"记忆调度"架构的 AI 记忆操作系统，我们希望通过 MemOS 全面重构模型记忆资源的生命周期管理，为智能系统提供高效且灵活的记忆管理能力。