发布日期:2025年9月30日 | 阅读时间:3分钟
今天,我们在Claude开发者平台上推出了管理agents上下文的新功能:上下文编辑(context editing)和记忆工具(memory tool)。
借助我们最新的模型Claude Sonnet 4.5,这些功能使开发者能够构建AI agents,能够以更高的性能处理长时间运行的任务,而不会触及上下文限制或丢失关键信息。
上下文窗口有限制,但实际工作没有
随着生产环境中的agents处理更复杂的任务并生成更多的工具结果,它们常常会耗尽有效的上下文窗口------让开发者不得不在裁剪agents转录内容或降低性能之间做出选择。上下文管理通过两种方式解决这个问题,帮助开发者确保只有相关数据保留在上下文中,宝贵的见解在会话之间得到保存。
上下文编辑在接近token限制时,会自动从上下文窗口中清除过时的工具调用和结果。当您的agents执行任务并积累工具结果时,上下文编辑会移除过时内容,同时保留对话流程,有效延长agents无需手动干预即可运行的时间。这也会提升模型性能,因为Claude只专注于相关上下文。

记忆工具使Claude能够通过基于文件的系统在上下文窗口之外存储和查询信息。Claude可以在您基础设施中存储的专用记忆目录中创建、读取、更新和删除文件,该目录在对话之间持久存在。这使得agents能够随着时间的推移建立知识库,在会话之间维护项目状态,并引用之前的学习内容,而无需将所有内容都保存在上下文中。
记忆工具完全通过工具调用在客户端运行。开发者管理存储后端,让他们完全控制数据存储位置和持久化方式。
Claude Sonnet 4.5通过内置的上下文感知功能增强了这两种能力------在整个对话过程中跟踪可用token,以更有效地管理上下文。
总的来说,这些更新创建了一个提升agents性能的系统:
- 通过自动从上下文中移除过时的工具结果来支持更长的对话
- 通过将关键信息保存到记忆中来提高准确性------并将这些学习成果带到连续的agents会话中
构建长时间运行的agents
Claude Sonnet 4.5是构建agents的世界最佳模型。这些功能为长时间运行的agents解锁了新的可能性------处理整个代码库、分析数百个文档,或维护广泛的工具交互历史。上下文管理在此基础上构建,确保agents能够高效利用这种扩展容量,同时处理超出任何固定限制的工作流程。用例包括:
编程: 上下文编辑清除旧的文件读取和测试结果,而记忆保存调试见解和架构决策,使agents能够处理大型代码库而不丢失进度。
研究: 记忆存储关键发现,而上下文编辑移除旧的搜索结果,建立随时间推移提升性能的知识库。
数据处理: agents将中间结果存储在记忆中,而上下文编辑清除原始数据,处理原本会超出token限制的工作流程。
上下文管理带来的性能提升
在一个agents搜索的内部评估集中,我们测试了上下文管理如何在复杂的多步骤任务上提升agents性能。结果显示显著收益:将记忆工具与上下文编辑结合比基线提升了39%的性能。仅上下文编辑就带来了29%的改进。
在一个100轮的网络搜索评估中,上下文编辑使agents能够完成原本会因上下文耗尽而失败的工作流程------同时将token消耗减少了84%。
开始使用
这些功能今天已在Claude开发者平台的公开测试版中提供,包括原生版本以及Amazon Bedrock和Google Cloud的Vertex AI。探索上下文编辑和 记忆工具的文档,或访问我们的 cookbook了解更多信息。