Token-efficient tool use

原文

"Token-efficient tool use" 是 Anthropic 在工具调用里提出的一个关键优化方向,尤其是在 Claude Code/Claude Agent SDK 。简单说,它是指 在调用外部工具时,尽量减少无谓的 token 消耗,同时保持任务完成的可靠性和覆盖度

大模型调用外部工具时,需要:

  1. 把上下文转成 prompt 传给模型。
  2. 把工具调用的输入/输出 包装到 prompt 或结果里再交给模型处理。

这些步骤往往会产生很多额外 token 消耗。例如:

  • 如果直接把整段长日志/大文件塞进上下文,会造成巨额 token 使用。
  • 工具输出如果不做摘要,原样回传,也会挤占上下文。

Claude 的做法

Claude 在"token-efficient tool use"上做了几类优化:

  1. 工具调用的上下文裁剪与摘要

    • 不是盲目把原始结果塞进 prompt,而是先用 grep/tail 等轻量脚本提取相关片段,或者先用小模型做 summarization,再把精简过的结果传回 Claude。
  2. 分块与按需加载

    • 例如面对一个大文件,Claude 会决定只加载开头/结尾的若干行,或者用 semantic index 按需检索,而不是一次性全读。
  3. 延迟解析与流式交互

    • Claude 会先发起最小化的工具调用,如果结果不足,再逐步扩展。这比"一口气加载所有内容"更省 token。
  4. 结果封装格式的优化

    • 工具返回的数据通常会用紧凑的 JSON 或表格结构,而不是长篇自然语言,便于 Claude 在后续 prompt 中高效使用。
相关推荐
2501_948114242 小时前
2026年大模型API聚合平台技术评测:企业级接入层的治理演进与星链4SAPI架构观察
大数据·人工智能·gpt·架构·claude
大强同学4 小时前
对比 VS Code:Zed 编辑器编码体验全面解析
人工智能·windows·编辑器·ai编程
小村儿6 小时前
连载04-最重要的Skill---一起吃透 Claude Code,告别 AI coding 迷茫
前端·后端·ai编程
可夫小子7 小时前
Claude Code 国内大模型方案:多模型并存、互不影响、可回滚(含配置模板)
claude
北冥有羽Victoria7 小时前
OpenCLI 操作网页 从0到1完整实操指南
vscode·爬虫·python·github·api·ai编程·opencli
Bigger7 小时前
第一章:我是如何剖析 Claude Code 整体架构与启动流程的
前端·aigc·claude
Thomas.Sir8 小时前
GitHub Copilot从入门到精通【从基础补全到智能代理,解锁AI编程全技能】
github·copilot·ai编程
加瓦点灯8 小时前
Vibe Coding 最佳实践:人控架构,AI执行
ai编程
财经资讯数据_灵砚智能9 小时前
基于全球经济类多源新闻的NLP情感分析与数据可视化(日间)2026年4月9日
人工智能·python·信息可视化·自然语言处理·ai编程
恋猫de小郭9 小时前
手机直接运行 Codex/OpenCode/Claude Code ,实时管理你的 AI Coding
前端·openai·ai编程