Token-efficient tool use

原文

"Token-efficient tool use" 是 Anthropic 在工具调用里提出的一个关键优化方向,尤其是在 Claude Code/Claude Agent SDK 。简单说,它是指 在调用外部工具时,尽量减少无谓的 token 消耗,同时保持任务完成的可靠性和覆盖度

大模型调用外部工具时,需要:

  1. 把上下文转成 prompt 传给模型。
  2. 把工具调用的输入/输出 包装到 prompt 或结果里再交给模型处理。

这些步骤往往会产生很多额外 token 消耗。例如:

  • 如果直接把整段长日志/大文件塞进上下文,会造成巨额 token 使用。
  • 工具输出如果不做摘要,原样回传,也会挤占上下文。

Claude 的做法

Claude 在"token-efficient tool use"上做了几类优化:

  1. 工具调用的上下文裁剪与摘要

    • 不是盲目把原始结果塞进 prompt,而是先用 grep/tail 等轻量脚本提取相关片段,或者先用小模型做 summarization,再把精简过的结果传回 Claude。
  2. 分块与按需加载

    • 例如面对一个大文件,Claude 会决定只加载开头/结尾的若干行,或者用 semantic index 按需检索,而不是一次性全读。
  3. 延迟解析与流式交互

    • Claude 会先发起最小化的工具调用,如果结果不足,再逐步扩展。这比"一口气加载所有内容"更省 token。
  4. 结果封装格式的优化

    • 工具返回的数据通常会用紧凑的 JSON 或表格结构,而不是长篇自然语言,便于 Claude 在后续 prompt 中高效使用。
相关推荐
天天扭码16 小时前
前端如何实现RAG?一文带你速通,使用RAG实现长期记忆
前端·node.js·ai编程
程序员鱼皮1 天前
全面封禁 Cursor!又一家大厂出手了
程序员·ai编程·cursor
树獭叔叔1 天前
模型编辑 vs 参数微调:给零算法基础AI从业者的讲解
aigc·openai·ai编程
用户47949283569151 天前
别搞混了!MCP 和 Agent Skill 到底有什么区别?
aigc·agent·ai编程
小徐_23331 天前
Gemini 3做粒子交互特效很出圈?拿 TRAE SOLO 来实现一波!
前端·ai编程·trae
云闲不收1 天前
AI编程系列——git-worktree并行开发
git·ai编程
undsky1 天前
【RuoYi-SpringBoot3-Pro】:接入 AI 对话能力
spring boot·ai编程
量子位1 天前
PPIO姚欣:AI正在进入自主行动与创造时代,智能体需要全新的操作系统|MEET2026
aigc·ai编程
king王一帅1 天前
告别 AI 输出的重复解析:正常 markdown 解析渲染也能提速 2-10 倍以上
前端·javascript·ai编程
量子位1 天前
小米语音首席科学家:AI发展的本质就像生物进化,不开源要慢1000倍 | MEET2026
aigc·ai编程