你的AI编程Token都花到哪了?

阅读本文大概需要5分钟

01---一个让我震惊的发现

用了3个月Claude Code,我以为自己很懂AI编程。

直到我装了codeburn。

这个工具告诉我一个残酷的事实:我80%的Token都浪费在"试错"上了。

什么意思?

写一段代码 → AI生成 → 不满意 → 修改提示词 → 再生成 → 还是不满意 → 再改...

循环往复,Token就这么没了。

一周下来,我花了$0.00(用的公司免费模型),但如果按Claude Pro算,可能烧掉几十刀。

今天用实测数据,告诉你AI编程的Token都去哪了,以及怎么省。

02---codeburn是什么

codeburn是一个开源的Token监控工具,GitHub上2.7K星,本周最火。

它能做什么?

  • 实时监控Claude Code、Cursor、Codex的Token消耗

  • 按项目、按活动类型、按模型分类统计

  • 计算"一次成功率"(1-shot rate)

  • 给出优化建议

安装很简单:

复制代码
npm install -g codeburn

# 或者直接运行
npx codeburn

不需要配置API Key,不需要改代码,直接读取本地会话数据。

03---我的实测数据(一周)

先上数据,再分析。

复制代码
$ codeburn status
Today  $0.0000  18 calls    Month  $0.0000  43 calls

看起来不多?但看详细 breakdown:

复制代码
$ codeburn report
7 Days Summary
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
Cost:        $0.0000
Calls:       18
Sessions:    3
Cache hit:   51.5%
Tokens in:   275.2K
Tokens out:  725
Cached:      291.7K

关键发现:

指标 数值 说明
Cache命中率 51.5% 一半请求命中缓存,省了不少
单次会话平均调用 6次 不算多,但也不算少
1-shot成功率 - 新项目,还没稳定

04---Token都花哪了

codeburn把活动分成了几类:

活动类型 占比 我的情况
Exploration(探索) 20% 尝试新思路
Conversation(对话) 50% 讨论需求
Brainstorming(头脑风暴) 10% 想方案
Coding(编码) 20% 实际写代码

发现问题了吗?

只有20%的Token花在"实际编码"上,80%都在"讨论"和"探索"。

这意味着什么?

  • 需求没想清楚就开始写

  • 反复修改方案

  • 没有明确的Prompt策略

05---codeburn的优化建议

codeburn不只是监控,还会给优化建议。

运行 codeburn optimize,我得到了这些:

复制代码
CodeBurn config health  Last 30 Days
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
6 sessions   43 calls   $0.0000   Health: B (86/100, 2 issues)

Potential savings: ~4.0K tokens

─── 1. Shrink bash output limit ──────────────────────── Medium ───

Your bash output cap is 30K chars (default). Most output
fits in 15K. The extra ~3.8K tokens per bash call is
trailing noise.

Potential savings: ~3.8K tokens (~$0.0000)

Add to ~/.zshrc or ~/.bashrc:
  export BASH_MAX_OUTPUT_LENGTH=15000

─── 2. 3 custom agents you never use ─────────────────── Medium ───

Defined in ~/.claude/agents/ but never invoked in this
period: CONTRIBUTING, CONTRIBUTING_zh-CN, README. Each
adds ~80 tokens to the Task tool schema on every session.

Potential savings: ~240 tokens (~$0.0000)

Archive unused agents:
  mv ~/.claude/agents/CONTRIBUTING.md ~/.claude/agents/.archived/

两条 actionable 的建议:

  1. 缩小bash输出限制 → 立省3.8K tokens

  2. 清理不用的agents → 省240 tokens

06---怎么省Token:我的5个技巧

基于codeburn的数据分析,我总结了5个省Token的技巧:

技巧1:先想清楚再动手

❌ 错误示范:

"帮我写个用户系统"
→ 写了一半发现不对
→ "再加个权限管理"
→ 又不对
→ "权限要分角色"

✅ 正确做法:

"帮我设计一个用户系统,需求如下:
`

  1. 支持注册/登录/找回密码
  2. 权限分管理员/普通用户/访客三级
  3. 使用JWT认证
  4. 技术栈:Node.js + MongoDB"`

一次给足上下文,减少来回次数。

技巧2:缩小输出限制

复制代码
# 加到 ~/.zshrc
export BASH_MAX_OUTPUT_LENGTH=15000

默认30K字符,大部分情况15K就够了。

技巧3:清理不用的agents

复制代码
# 查看有哪些agents
ls ~/.claude/agents/
# 不用的移到归档
mv ~/.claude/agents/xxx.md ~/.claude/agents/.archived/

每个agent都会占用Token预算。

技巧4:善用缓存

Claude Code有缓存机制,相同的内容不会重复计费。

技巧: 把常用的上下文写成文件,让AI读取,而不是每次粘贴。

# 写个CLAUDE.md放在项目根目录
`

里面放项目规范、技术栈、常用命令`

技巧5:监控1-shot成功率

codeburn会统计"一次成功率",也就是AI第一次就答对的概率。

如果某个活动类型的1-shot率很低,说明你的Prompt需要优化。

07---不同工具的对比

codeburn支持多个AI编程工具:

工具 数据位置 监控精度
Claude Code ~/.claude/projects/ ⭐⭐⭐⭐⭐
Codex ~/.codex/sessions/ ⭐⭐⭐⭐⭐
Cursor SQLite数据库 ⭐⭐⭐⭐
OpenCode ~/.local/share/opencode/ ⭐⭐⭐⭐
GitHub Copilot session-state ⭐⭐⭐

Cursor的特殊情况:

Cursor用的是SQLite数据库,codeburn会读取token使用量。但Cursor的"Auto"模式隐藏了实际模型,成本按Sonnet估算(显示为"Auto (Sonnet est.)")。

08---我的结论

用了一周codeburn,我的感受是:

AI编程最大的成本不是模型费用,而是"试错成本"。

每次"再试一次"、"这样改一下"、"还是不对",都是在烧钱。

codeburn的价值不在于"监控",而在于让你意识到自己的使用习惯有多贵

三个行动建议:

  1. 装codeburn,看看自己的Token都去哪了

  2. 优化Prompt策略,一次给足上下文

  3. 定期清理,不用的agents、过大的输出限制

省下的Token,就是赚到的钱。


09---快速开始

复制代码
# 安装
npm install -g codeburn

# 查看今日状态
codeburn today

# 查看本周报告
codeburn report

# 获取优化建议
codeburn optimize

# 导出数据
codeburn export -f json

GitHub: getagentseal/codeburn

相关推荐
Bigger2 小时前
我手搓了一个开源版 Claude Code (mini-cc)
前端·ai编程·claude
朦胧之13 小时前
AI 编程开发思维
前端·后端·ai编程
甲维斯13 小时前
Opus4.7克隆 Claude 继续!接入GLM5实现聊天功能
ai编程·vibecoding
Karl_wei13 小时前
企业级 Vibe Coding 实操
openai·ai编程·cursor
oden14 小时前
省下的就是净利润:手把手教你用模型路由砍掉 80% 的 OpenClaw 账单
aigc·ai编程·aiops
爱吃的小肥羊15 小时前
2026 Claude Design 完整指南:功能介绍+使用教程+Claude会员订阅方法
aigc·ai编程
带你去学习15 小时前
codex app每次打开重连5次Reconnecting问题解决
ai·ai编程
麦哲思科技任甲林16 小时前
大懒人AI结对工作模式——驾驭AI编程的进阶指南
人工智能·ai编程·结对编程·工作模式·ai赋能