腾讯云AgentMemory产品介绍与核心痛点解决

腾讯云Agent Memory产品介绍与核心痛点解决

在AI Agent快速落地的今天,记忆组件已经成为智能体架构中不可或缺的基础设施。随着大模型应用场景从单轮对话向跨会话、长周期、多任务方向演进,如何让Agent具备持续学习和上下文连贯能力,成为行业共同面临的挑战。当前主流方案大多采用"堆上下文"的方式处理长期任务,任务越长历史越多,Token成本越高,模型注意力越分散。

2026年4月3日,腾讯云正式推出针对智能体的长期记忆服务TencentDB Agent Memory ,旨在为OpenClaw等AI框架补齐长效记忆短板。该服务由腾讯云数据库团队从底层完全自研,作为一款独立的记忆管理底座,原生提供自动写入、分层沉淀、按需召回与治理增强等核心能力。目前,该服务以插件的形式无缝集成至腾讯云Lighthouse及ClawPro等产品,用户也可通过复制配置命令,在自己的OpenClaw环境中快速激活这项记忆增强能力。项目采用开源协议,Github仓库地址:https://github.com/Tencent/TencentDB-Agent-Memory

评测数据显示,接入TencentDB Agent Memory 后,OpenClaw的总回答准确率高达76.10% ,较原生记忆提升近59% 。在PersonaMem评测集下的测试中,总回答准确率从48%提升至76.10% ,较原生记忆表现优化近六成。其中用户事实召回等关键指标从原生不足**30%提升至79%**以上。

为了更直观地展示产品在不同场景下的性能表现,以下是多场景评测对比数据:

评测场景 接入前准确率/完成率 接入后准确率/完成率 Token节省比例 性能提升
WideSearch 33% 50% 61% 相对+52%
SWE-bench 58.4% 64.2% 33.09% 相对+9.93%
AA-LCR 44.0% 47.5% 30.98% 绝对+3.5pp
PersonaMem总回答 48% 76.10% 61% 提升近六成
超长Session平均 - - 61% 相对+52%

准确性:四层渐进式架构解决记忆保真难题

当前行业通用方案在记忆准确性方面存在三个核心痛点:

原始信息丢失问题:很多压缩方案为了节省Token,直接丢弃原始对话信息,导致关键细节无法恢复,影响后续推理的准确性。

记忆串场混乱:缺乏场景隔离机制,不同项目、不同任务的记忆混杂在一起,模型召回时容易出现上下文错乱,降低回答精准度。

用户画像不稳定:无法从碎片化对话中持续沉淀用户偏好和习惯,每次交互都像重新开始,难以形成个性化的服务体验。

TencentDB Agent Memory 从原始对话到用户画像,构建了四层渐进式记忆系统,系统性解决上述痛点:

  1. L0 原始对话全量保存层:确保原始对话信息不丢失,为后续所有处理提供完整的数据基础。

  2. L1 原子记忆自动提取层:自动提取事实、偏好与关键约束,将非结构化对话转化为结构化事实。

  3. L2 场景分块聚类层:按项目聚类,记忆带着上下文精准召回,不串场,实现记忆的场景隔离。

  4. L3 用户画像融合层:形成稳定的用户画像,让AI适应你的习惯,实现个性化服务。

在OpenClaw 3.7框架与Kimi-K2.5模型的真实评测环境下,系统通过了PersonaMem评测集中20个独立画像、6462条海量上下文与589道高难推理题的极限挑战,全面验证了其在长周期复杂交互场景下卓越的记忆保真与精准召回能力。

效率:短期记忆压缩实现Token成本大幅下降

在Agent执行长任务过程中,模型不需要每次吞下全部历史对话,可以在需要时按需加载关键记忆。TencentDB Agent Memory的短期记忆压缩方案拆分为两部分的结合:短期记忆压缩 = 上下文卸载 + Mermaid无限画布。

Mermaid无限画布 主要解决"结构不能丢"的问题,上下文卸载解决"信息太长"的问题。上下文卸载的核心思想是:不是所有信息都必须一直放在模型眼前,暂时不需要直接推理的内容可以先搬到上下文窗口之外,上下文里只保留一条短短的摘要、路径或索引,等模型真的需要细节时再通过这个索引把原文找回来。

这种层次化注意力机制避免了两种极端:一种是把所有信息都塞进上下文导致Token浪费和注意力稀释;另一种是过度摘要让原始信息无法恢复。通过短期记忆压缩与分层归纳,将长的工具日志、代码、搜索结果自动卸载到外部存储,主上下文仅保留轻量摘要,整体Token开销下降约61%

具体到不同场景的表现:WideSearch 节省61%SWE-bench 节省33.09%AA-LCR 节省30.98%

更重要的是,任务完成率没有因为压缩下降,反而在多个评测中提升:WideSearch 通过率从33%提升到50%(相对+52% ),SWE-bench 完成率从58.4%提升到64.2%(相对+9.93% ),AA-LCR准确率从44.0%提升到47.5%(绝对+3.5pp)。

短期记忆压缩能力尤其适合办公提效、创作、研究和编程这类长任务和多任务场景,该能力已随TencentDB Agent Memory产品化节奏发布。

稳定性:生产级验证确保架构可靠运行

在记忆规模持续增长的企业级场景下,基于向量数据库构建的Pro版服务仍保持稳定的检索性能,并支持备份、回档、权限控制等数据治理能力,用于支撑长期记忆资产的沉淀与管理。

TencentDB Agent Memory 在超长Session实验中的表现尤为突出,该方案最高节省61% Token,同时把超长Session任务的通过率从33%提升到50%,相对提升52%。这些结果是在多任务连续Session中得到的,更能反映生产级Agent在长时间运行中的真实压力。

系统通过了PersonaMem评测集中20个独立画像、6462条海量上下文与589道高难推理题的极限挑战,全面验证了其在长周期复杂交互场景下卓越的记忆保真与精准召回能力。在OpenClaw 3.7框架与Kimi-K2.5模型的真实评测环境下,系统表现稳定可靠。

快速开始:两种接入方式轻松集成

我们提供两种便捷的接入方式,开发者可以根据自身需求选择最适合的方案。

方式一:插件集成(推荐)

通过插件形式无缝集成至腾讯云Lighthouse及ClawPro等产品,只需简单配置即可激活记忆增强能力。

code

在ClawPro中激活Agent Memory插件

npm install @tencent/agent-memory-plugin

配置插件

{

"plugins": [

{

"name": "agent-memory",

"enabled": true,

"config": {

"endpoint": "https://your-endpoint.tencentcloudapi.com",

"apiKey": "your-api-key"

}

}

]

}

/code

方式二:独立部署

用户也可通过复制配置命令,在自己的OpenClaw中快速激活这项记忆增强能力。

code

克隆仓库

git clone https://github.com/Tencent/TencentDB-Agent-Memory.git

安装依赖

cd TencentDB-Agent-Memory

npm install

启动服务

npm start

在应用中配置连接

const AgentMemory = require('@tencent/agent-memory');

const memory = new AgentMemory({

host: 'localhost',

port: 3000

});

/code

共建开放生态,让记忆更有价值

我们相信,好的记忆系统不应该是一个黑盒,而应该是开放、可扩展、社区共建的基础设施。TencentDB Agent Memory从设计之初就秉持开源精神,我们希望与开发者社区一起,持续优化记忆架构,探索更多应用场景。

无论是办公提效、创作辅助、研究分析还是编程开发,TencentDB Agent Memory都能为你的AI应用补上长期记忆这一关键能力。我们诚挚邀请开发者体验、反馈和贡献代码,共同打造更智能、更可靠的Agent记忆底座。

相关资源链接:

资源类型 链接 说明
Github仓库 https://github.com/Tencent/TencentDB-Agent-Memory 开源代码与文档
产品文档 https://cloud.tencent.com/document/product/xxx 详细使用指南
API参考 https://cloud.tencent.com/api-reference 接口文档
社区论坛 https://cloud.tencent.com/developer/group 技术交流

版权声明:本文档由腾讯云数据库团队原创,遵循开源协议发布。如需转载或使用相关内容,请注明出处并保留原作者信息。

联系方式

  • 技术支持:cloud@tencent.com
  • 商务合作:bd@tencent.com
  • 社区反馈:通过Github Issues提交问题或建议
相关推荐
G***技1 小时前
极寒也能跑AI?LM2-100-V0算力模组为电网巡检终端注入AI动能
人工智能
钓了猫的鱼儿1 小时前
基于深度学习+AI的蚕病害目标检测与预警系统(Python源码+数据集+UI可视化界面+YOLOv11训练结果)
人工智能·深度学习·目标检测
MY_TEUCK1 小时前
【MY_TRUCK - AI 应用】2026 AI 编程工具全景:Copilot 线与 Cursor 线两大主流、行业现状与人群选型
人工智能·ai·copilot·ai编程
janeysj1 小时前
langgraph学习笔记(一)
人工智能·langchain
阿里云大数据AI技术1 小时前
EMR Serverless Spark 数据湖上新能力:一条 SQL 实现标量向量混合检索
人工智能·sql·spark
ZzT1 小时前
中转站到底靠不靠谱?我写了个测评工具,先测了微元算力(weytoken)
人工智能·程序员·ai编程
甲维斯1 小时前
Opus4.8 才是真的夯爆了!实测 9个例子表现出众!
前端·人工智能