Claude Code Token 烧得太快?这8个方案帮你立省90%!

前言

token越来越贵了,而且高等级模型消耗的token量也在增加,平时跑点任务code套餐根本不够用。本文为你梳理了8个经过实战验证的节省策略

1.模型选择

不同的模型,回答同一个问题的,消耗的token量会有几倍的区别。

使用 /model 进行模型切换,简单任务用 Haiku,日常用 Sonnet,复杂推理用 Opus。

2.上下文管理

1. 定期 /compact

对于长对话定期使用 /compact 压缩

使用 /context 查看压缩之前的上下文,总共200K的上下文占用了88%

使用 /compact 进行上下文压缩后的大小为55.7K,占用了28%

如果一直不清理,上下文占满后,会报错提示 Context limit reached · /compact or /clear to continue

2.阶段性 /clear

对于新任务先使用 /clear 清理上下文

3.恢复对话

如果Claude code意外关闭,又想继续会话时,可使用 claude --continue 重连会话,以便跳过初始化开销;

或者使用 claude --resume 重连某一个历史会话

4.临时提问

/btw 是 By The Way 的缩写,作用是让你可以"顺便问一句",提问但不消耗上下文Token

5.只加载需要的文件

使用 @ 提及,引用单个文件或目录,限制 Claude Code的搜索范围

js 复制代码
# 引用单个文件
@src/auth.ts

# 引用整个目录
@src/components/

# 引用多个文件
@src/auth.ts @src/user.ts @src/database.ts

3.启用LSP

LSP (Language Server Protocol) 是语言服务器协议,相当于AI的"高级导航",配置之后能省下大约40%(官方数据)的Token消耗。

1.为什么能节省token?

对比维度 配置 LSP 之前 (模糊搜索) 配置 LSP 之后 (精准定位)
工作方式 纯文本字符串匹配 (grep) 语法树分析,理解代码含义
典型操作 搜索函数名,返回所有匹配行 直接"跳转到定义",一步到位
上下文理解 不理解作用域,可能混淆同名变量 完全理解作用域,识别真正的函数调用关系
准确性 低,噪音多,需要AI二次筛选 高,结果精准,无需额外判断
消耗的Token 极高,需要处理大量无关结果 较低,只处理精确的、有意义的信息

2.示例

安装语言服务器 + 对应claude code插件,以TypeScript项目为例

在终端中运行

js 复制代码
npm install -g typescript-language-server typescript

typescript-language-server:负责理解代码语法、提供类型信息、查找引用等,是一个独立的引擎。

在claude中运行

js 复制代码
/plugin install typescript-lsp

typescript-lsp:告诉 Claude Code 如何启动并连接 typescript-language-server。

安装LSP之前,查询一个函数大约花费0.4319刀

安装LSP之后,查询同一个函数大约花费0.2137刀。input的token量从58.8K降到29.9k

4.启用计划模式

对于小需求,使用 /plan 开启计划模式;对于中大型需求,使用Superpowers插件;做到先规划后执行,减少试错。

plan模式:Claude Code 会安全地探索代码库、构思解决方案并制定详细的实施计划,而不会触碰或修改任何文件。

Superpowers 的核心理念是通过一套标准化的工作流程,引导 AI 在动手写代码之前,先进行需求澄清、方案设计和测试用例编写,从而减少因规划不足导致的返工和混乱

Superpowers 的核心由以下三个核心技能组成:

技能命令 阶段目标 工作流中的角色与行为
brainstorming 需求分析与设计 强制Claude先进行多轮对话,通过提问来彻底理解你的需求,评估不同方案的优劣,并对齐双方的认知。最终会将讨论结果整理并保存到 docs/plans/ 目录下。
writing-plan 制定开发计划 当需求确认后,Claude会基于设计方案,将复杂的开发任务拆解为一系列独立、细粒度(如2-5分钟可完成)的实施步骤,并为每步设定清晰的验证标准。
execute-plan 执行计划(含TDD) 开始逐项执行开发计划。在这个阶段,它会采用测试驱动开发(TDD) 模式:1. RED: 先写一个必然失败的测试。2. GREEN: 编写刚好能让测试通过的代码。3. REFACTOR: 在测试保护下优化代码**。完成一项后,会等待你确认再进入下一步。

5. 管理规则

1.全局规则 CLAUDE.md

使用 /init 命令能够快捷创建CLAUDE.md文件

CLAUDE.md 是 Claude Code 的"项目记忆文件",记录项目结构、构建命令、代码规范、架构决策等信息,让 Claude Code 快速理解项目上下文

可将项目通用规则放在 CLAUDE.md 中,以提供持久上下文

但也要注意,CLAUDE.md 如果内容过长,反而会消耗大量token。将 CLAUDE.md 控制在 200 行以内是性能与成本的最佳平衡点。

对于单体大仓库,全局的 CLAUDE.md(控制在200行以内)往往是不够用的,因此还需要借助作用域规则

2.路径规则 (.claude/rules/)

当访问特定目录下的文件,才会加载的规则。项目目录结构

js 复制代码
your-project/
├── .claude/
│   └── rules/
│       ├── code-style.md  # 编码风格规则 (通用)
│       ├── testing.md     # 测试规则 (通用)
│       └── api-rules.md   # API 开发规范 (仅作用于特定路径)

例如只希望 AI 在处理 src/service/** 目录下的文件时,遵循 API 开发规范。可以创建 .claude/rules/api-rules.md 文件

js 复制代码
---
paths:
  - 'src/service/**/*.ts'
name: API开发规范
description: 项目API层的编码与安全标准
---

# API开发规则

1.  **必须** 使用 TypeScript 严格模式 (`"strict": true`)。
2.  **必须** 为所有 API 添加中文注释。

保存文件后,重启claude code,提问: 你知道我们项目的 API 开发规范吗?

再让AI去按照规则去修改,提问:按照api规则帮我重构对应文件。

AI会将service文件夹下的函数或类型接口等都添加了中文注释

6. 数据预处理

利用 PreToolUse 钩子(类似于请求拦截器),在 Claude 执行操作前,对输入的数据进行处理、压缩,从而达到减小token使用量。

示例:使用 rtk

rtk会拦截并重写 Bash 命令的输出,比如 git diff 只展示文件差异的核心摘要。

1.rtk安装(Windows)

1.访问 github.com/rtk-ai/rtk/...

2.在页面中找到类似 rtk-x86_64-pc-windows-msvc.zip 的文件,下载到本地

3.将下载的压缩包解压,放在一个你方便管理的专属文件夹,例如 D:\Develop\rtk

4.在用户变量和系统变量列表中找到 Path,选中后点击编辑,新增 D:\Develop\rtk

5.重启 PowerShell 或 CMD 终端,运行

js 复制代码
rtk --version

如果有版本号,说明安装成功

2.配置到claude

在 PowerShell 或 CMD 终端中运行

js 复制代码
rtk init --global

安装成功后,在claude中运行 /hooks,可以看到 rtk 已安装在PreToolUse中

我本地修改了一些文件,然后运行

js 复制代码
git diff | claude -p "解释这些更改"

安装 rtk 之前的token消耗大约0.0970刀

安装 rtk 之后的token消耗大约0.0542刀,input的token量从13.2k降到了3.5k

提示:除了使用 git 命令,使用 cat / read 命令去读文件内容时,也能大幅度减小input输入量

7.自动化内存管理

Claude Code 默认是自动开启Auto Memory 功能,该功能会自动保存跨会话的学习心得,如构建命令、调试经验等。

这个"笔记本"在每个项目中都有自己独立的文件夹。文件路径:~/.claude/projects/<项目名>/memory/

需要定期清理已过时或不再准确的偏好设置,否则每次会话都会加载

8.生成.claudeignore

配置之后,大模型在上下文分析和代码搜索时不会自动包含它们

可让AI直接生成一份配置文件:创建一个 .claudeignore 文件,帮我排除掉不必要的目录,比如 node_modules

结尾

如果有更多可以节省token的方案,可以在评论区留言,文章会定期更新!

创作不易,欢迎点赞支持!!!

相关推荐
可视之道1 小时前
设备拓扑图中的实时状态映射与动画策略:告警闪烁、流向动画、质量码怎么共存
前端
涂兵兵_青石疏影1 小时前
绘制图像-clip方法
前端
Lonwayne1 小时前
从提示词工程到驾驭工程:AI协作的三代进化
人工智能·ai·ai编程·ai智能体
焦糖玛奇朵婷2 小时前
解锁扭蛋机小程序的五大优势
java·大数据·服务器·前端·小程序
SwJieJie2 小时前
windsurf的配置和项目规则、工作流、agent技巧使用
前端
白日梦想家6812 小时前
从基础入手,分清一次性定时器与永久定时器
前端
AIwork4me2 小时前
别再把 RAG 当知识库:用 AutoClaw 搭一套会进化的 Karpathy LLM Wiki
前端
彩票管理中心秘书长2 小时前
Git 归档与补丁命令大全(完整详解版)
前端
RePeaT2 小时前
【Nginx】前端项目部署与反向代理实战指南
前端·nginx