选题编号:7
写作日期:2026-05-17
主要来源:arXiv:2605.15156,Submitted on 14 May 2026
一句话判断
MeMo 把"长期记忆"从向量库外挂,推进为一个可训练、可替换、与基础模型解耦的记忆模型。
为什么它值得写
这篇论文击中了 Agent 落地时最常见的矛盾:基础模型不能每天重训,但业务知识、产品规则、用户上下文和跨文档关系每天都在变化。
在过去一年里,Agent 的讨论经常被两个问题卡住:第一,模型本身越来越强,但外部知识、工具调用、上下文和算力调度并没有同步变得可控;第二,很多系统演示看起来像智能体,真正落地时却败在延迟、遗忘、检索噪声、调度成本或不可观测性上。MeMo 的价值,不在于又多了一个概念,而在于它把一个工程瓶颈从"玄学调参"重新拉回到可设计、可替换、可验证的系统层。
核心机制
MeMo 的关键不是把所有材料塞进上下文,而是把新增知识编码进独立的 memory model。基础 LLM 的参数保持冻结,推理时通过这个记忆模型补充及时、领域化的信息。论文强调它能捕捉跨文档关系,面对检索噪声更稳,同时避免把新知识直接微调进 LLM 后带来的灾难性遗忘。
换句话说,它没有简单地说"模型还不够聪明",而是把问题拆成更具体的接口:知识应该怎样进入系统,工具结果应该怎样等待,长上下文应该怎样组织,推理任务应该怎样分配。这个角度对开发者更有价值,因为它意味着改进不一定等下一个基础模型发布,也可能发生在模型外面的执行层、记忆层、上下文层和调度层。