在Claude开发者平台上管理上下文

转载

发布日期:2025年9月30日 | 阅读时间:3分钟

今天,我们在Claude开发者平台上推出了管理agents上下文的新功能:上下文编辑(context editing)和记忆工具(memory tool)。

借助我们最新的模型Claude Sonnet 4.5,这些功能使开发者能够构建AI agents,能够以更高的性能处理长时间运行的任务,而不会触及上下文限制或丢失关键信息。

上下文窗口有限制,但实际工作没有

随着生产环境中的agents处理更复杂的任务并生成更多的工具结果,它们常常会耗尽有效的上下文窗口------让开发者不得不在裁剪agents转录内容或降低性能之间做出选择。上下文管理通过两种方式解决这个问题,帮助开发者确保只有相关数据保留在上下文中,宝贵的见解在会话之间得到保存。

上下文编辑在接近token限制时,会自动从上下文窗口中清除过时的工具调用和结果。当您的agents执行任务并积累工具结果时,上下文编辑会移除过时内容,同时保留对话流程,有效延长agents无需手动干预即可运行的时间。这也会提升模型性能,因为Claude只专注于相关上下文。

记忆工具使Claude能够通过基于文件的系统在上下文窗口之外存储和查询信息。Claude可以在您基础设施中存储的专用记忆目录中创建、读取、更新和删除文件,该目录在对话之间持久存在。这使得agents能够随着时间的推移建立知识库,在会话之间维护项目状态,并引用之前的学习内容,而无需将所有内容都保存在上下文中。

记忆工具完全通过工具调用在客户端运行。开发者管理存储后端,让他们完全控制数据存储位置和持久化方式。

Claude Sonnet 4.5通过内置的上下文感知功能增强了这两种能力------在整个对话过程中跟踪可用token,以更有效地管理上下文。

总的来说,这些更新创建了一个提升agents性能的系统:

  • 通过自动从上下文中移除过时的工具结果来支持更长的对话
  • 通过将关键信息保存到记忆中来提高准确性------并将这些学习成果带到连续的agents会话中

构建长时间运行的agents

Claude Sonnet 4.5是构建agents的世界最佳模型。这些功能为长时间运行的agents解锁了新的可能性------处理整个代码库、分析数百个文档,或维护广泛的工具交互历史。上下文管理在此基础上构建,确保agents能够高效利用这种扩展容量,同时处理超出任何固定限制的工作流程。用例包括:

编程: 上下文编辑清除旧的文件读取和测试结果,而记忆保存调试见解和架构决策,使agents能够处理大型代码库而不丢失进度。

研究: 记忆存储关键发现,而上下文编辑移除旧的搜索结果,建立随时间推移提升性能的知识库。

数据处理: agents将中间结果存储在记忆中,而上下文编辑清除原始数据,处理原本会超出token限制的工作流程。

上下文管理带来的性能提升

在一个agents搜索的内部评估集中,我们测试了上下文管理如何在复杂的多步骤任务上提升agents性能。结果显示显著收益:将记忆工具与上下文编辑结合比基线提升了39%的性能。仅上下文编辑就带来了29%的改进。

在一个100轮的网络搜索评估中,上下文编辑使agents能够完成原本会因上下文耗尽而失败的工作流程------同时将token消耗减少了84%。

开始使用

这些功能今天已在Claude开发者平台的公开测试版中提供,包括原生版本以及Amazon Bedrock和Google Cloud的Vertex AI。探索上下文编辑 记忆工具的文档,或访问我们的 cookbook了解更多信息。


相关推荐
counterxing3 小时前
Agent 跑起来之后,难的是复用、观测和评测
node.js·agent·ai编程
uccs3 小时前
大模型底层机制与Agent开发
agent·ai编程·claude
counterxing4 小时前
我把 Codex 里的 Skills 做成了一个 MCP,还支持分享
前端·agent·ai编程
夜雪闻竹4 小时前
vectra 向量索引文件损坏怎么办
ai编程·向量·vectra
ZzT4 小时前
Harness 到底指什么
openai·ai编程·claude
宅小年4 小时前
AI 创业最危险的地方:太容易做出来
openai·ai编程·claude
麦客奥德彪4 小时前
Android Skills
架构·ai编程
言萧凡_CookieBoty5 小时前
一文讲清 RAG:让 AI 读懂业务知识库的核心方法
ai编程
kyriewen6 小时前
产品经理把PRD写成“天书”,我用AI半小时重写了一遍,他当场愣住
前端·ai编程·cursor
Patrick_Wilson6 小时前
知识沉淀的四层模型:从个人笔记到企业资产,让文档真正长出复利
面试·程序员·ai编程