前言
token越来越贵了,而且高等级模型消耗的token量也在增加,平时跑点任务code套餐根本不够用。本文为你梳理了8个经过实战验证的节省策略
1.模型选择
不同的模型,回答同一个问题的,消耗的token量会有几倍的区别。
使用 /model 进行模型切换,简单任务用 Haiku,日常用 Sonnet,复杂推理用 Opus。
2.上下文管理
1. 定期 /compact
对于长对话定期使用 /compact 压缩
使用 /context 查看压缩之前的上下文,总共200K的上下文占用了88%

使用 /compact 进行上下文压缩后的大小为55.7K,占用了28%

如果一直不清理,上下文占满后,会报错提示 Context limit reached · /compact or /clear to continue

2.阶段性 /clear
对于新任务先使用 /clear 清理上下文
3.恢复对话
如果Claude code意外关闭,又想继续会话时,可使用 claude --continue 重连会话,以便跳过初始化开销;
或者使用 claude --resume 重连某一个历史会话
4.临时提问
/btw 是 By The Way 的缩写,作用是让你可以"顺便问一句",提问但不消耗上下文Token
5.只加载需要的文件
使用 @ 提及,引用单个文件或目录,限制 Claude Code的搜索范围
js
# 引用单个文件
@src/auth.ts
# 引用整个目录
@src/components/
# 引用多个文件
@src/auth.ts @src/user.ts @src/database.ts
3.启用LSP
LSP (Language Server Protocol) 是语言服务器协议,相当于AI的"高级导航",配置之后能省下大约40%(官方数据)的Token消耗。
1.为什么能节省token?
2.示例
安装语言服务器 + 对应claude code插件,以TypeScript项目为例
在终端中运行
js
npm install -g typescript-language-server typescript
typescript-language-server:负责理解代码语法、提供类型信息、查找引用等,是一个独立的引擎。
在claude中运行
js
/plugin install typescript-lsp
typescript-lsp:告诉 Claude Code 如何启动并连接 typescript-language-server。
安装LSP之前,查询一个函数大约花费0.4319刀

安装LSP之后,查询同一个函数大约花费0.2137刀。input的token量从58.8K降到29.9k

4.启用计划模式
对于小需求,使用 /plan 开启计划模式;对于中大型需求,使用Superpowers插件;做到先规划后执行,减少试错。
plan模式:Claude Code 会安全地探索代码库、构思解决方案并制定详细的实施计划,而不会触碰或修改任何文件。
Superpowers 的核心理念是通过一套标准化的工作流程,引导 AI 在动手写代码之前,先进行需求澄清、方案设计和测试用例编写,从而减少因规划不足导致的返工和混乱
Superpowers 的核心由以下三个核心技能组成:
| 技能命令 | 阶段目标 | 工作流中的角色与行为 |
| brainstorming | 需求分析与设计 | 强制Claude先进行多轮对话,通过提问来彻底理解你的需求,评估不同方案的优劣,并对齐双方的认知。最终会将讨论结果整理并保存到 docs/plans/ 目录下。 |
| writing-plan | 制定开发计划 | 当需求确认后,Claude会基于设计方案,将复杂的开发任务拆解为一系列独立、细粒度(如2-5分钟可完成)的实施步骤,并为每步设定清晰的验证标准。 |
| execute-plan | 执行计划(含TDD) | 开始逐项执行开发计划。在这个阶段,它会采用测试驱动开发(TDD) 模式:1. RED: 先写一个必然失败的测试。2. GREEN: 编写刚好能让测试通过的代码。3. REFACTOR: 在测试保护下优化代码**。完成一项后,会等待你确认再进入下一步。 |
5. 管理规则
1.全局规则 CLAUDE.md
使用 /init 命令能够快捷创建CLAUDE.md文件
CLAUDE.md 是 Claude Code 的"项目记忆文件",记录项目结构、构建命令、代码规范、架构决策等信息,让 Claude Code 快速理解项目上下文
可将项目通用规则放在 CLAUDE.md 中,以提供持久上下文
但也要注意,CLAUDE.md 如果内容过长,反而会消耗大量token。将 CLAUDE.md 控制在 200 行以内是性能与成本的最佳平衡点。
对于单体大仓库,全局的 CLAUDE.md(控制在200行以内)往往是不够用的,因此还需要借助作用域规则
2.路径规则 (.claude/rules/)
当访问特定目录下的文件,才会加载的规则。项目目录结构
js
your-project/
├── .claude/
│ └── rules/
│ ├── code-style.md # 编码风格规则 (通用)
│ ├── testing.md # 测试规则 (通用)
│ └── api-rules.md # API 开发规范 (仅作用于特定路径)
例如只希望 AI 在处理 src/service/** 目录下的文件时,遵循 API 开发规范。可以创建 .claude/rules/api-rules.md 文件
js
---
paths:
- 'src/service/**/*.ts'
name: API开发规范
description: 项目API层的编码与安全标准
---
# API开发规则
1. **必须** 使用 TypeScript 严格模式 (`"strict": true`)。
2. **必须** 为所有 API 添加中文注释。
保存文件后,重启claude code,提问: 你知道我们项目的 API 开发规范吗?

再让AI去按照规则去修改,提问:按照api规则帮我重构对应文件。
AI会将service文件夹下的函数或类型接口等都添加了中文注释

6. 数据预处理
利用 PreToolUse 钩子(类似于请求拦截器),在 Claude 执行操作前,对输入的数据进行处理、压缩,从而达到减小token使用量。
示例:使用 rtk
rtk会拦截并重写 Bash 命令的输出,比如 git diff 只展示文件差异的核心摘要。
1.rtk安装(Windows)
1.访问 github.com/rtk-ai/rtk/...
2.在页面中找到类似 rtk-x86_64-pc-windows-msvc.zip 的文件,下载到本地
3.将下载的压缩包解压,放在一个你方便管理的专属文件夹,例如 D:\Develop\rtk
4.在用户变量和系统变量列表中找到 Path,选中后点击编辑,新增 D:\Develop\rtk
5.重启 PowerShell 或 CMD 终端,运行
js
rtk --version
如果有版本号,说明安装成功
2.配置到claude
在 PowerShell 或 CMD 终端中运行
js
rtk init --global
安装成功后,在claude中运行 /hooks,可以看到 rtk 已安装在PreToolUse中

我本地修改了一些文件,然后运行
js
git diff | claude -p "解释这些更改"
安装 rtk 之前的token消耗大约0.0970刀

安装 rtk 之后的token消耗大约0.0542刀,input的token量从13.2k降到了3.5k

提示:除了使用 git 命令,使用 cat / read 命令去读文件内容时,也能大幅度减小input输入量
7.自动化内存管理
Claude Code 默认是自动开启Auto Memory 功能,该功能会自动保存跨会话的学习心得,如构建命令、调试经验等。
这个"笔记本"在每个项目中都有自己独立的文件夹。文件路径:~/.claude/projects/<项目名>/memory/
需要定期清理已过时或不再准确的偏好设置,否则每次会话都会加载
8.生成.claudeignore
配置之后,大模型在上下文分析和代码搜索时不会自动包含它们
可让AI直接生成一份配置文件:创建一个 .claudeignore 文件,帮我排除掉不必要的目录,比如 node_modules
结尾
如果有更多可以节省token的方案,可以在评论区留言,文章会定期更新!
创作不易,欢迎点赞支持!!!