Claude Code Token 烧得太快？这8个方案帮你立省90%！

前言

token越来越贵了，而且高等级模型消耗的token量也在增加，平时跑点任务code套餐根本不够用。本文为你梳理了8个经过实战验证的节省策略

1.模型选择

不同的模型，回答同一个问题的，消耗的token量会有几倍的区别。

使用 /model 进行模型切换，简单任务用 Haiku，日常用 Sonnet，复杂推理用 Opus。

2.上下文管理

1. 定期 /compact

对于长对话定期使用 /compact 压缩

使用 /context 查看压缩之前的上下文，总共200K的上下文占用了88%

使用 /compact 进行上下文压缩后的大小为55.7K，占用了28%

如果一直不清理，上下文占满后，会报错提示 Context limit reached · /compact or /clear to continue

2.阶段性 /clear

对于新任务先使用 /clear 清理上下文

3.恢复对话

如果Claude code意外关闭，又想继续会话时，可使用 claude --continue 重连会话，以便跳过初始化开销；

或者使用 claude --resume 重连某一个历史会话

4.临时提问

/btw 是 By The Way 的缩写，作用是让你可以"顺便问一句"，提问但不消耗上下文Token

5.只加载需要的文件

使用 @ 提及，引用单个文件或目录，限制 Claude Code的搜索范围

js 复制代码

# 引用单个文件
@src/auth.ts

# 引用整个目录
@src/components/

# 引用多个文件
@src/auth.ts @src/user.ts @src/database.ts

3.启用LSP

LSP (Language Server Protocol) 是语言服务器协议，相当于AI的"高级导航"，配置之后能省下大约40%（官方数据）的Token消耗。

1.为什么能节省token？


对比维度	配置 LSP 之前 (模糊搜索)	配置 LSP 之后 (精准定位)
工作方式	纯文本字符串匹配 (grep)	语法树分析，理解代码含义
典型操作	搜索函数名，返回所有匹配行	直接"跳转到定义"，一步到位
上下文理解	不理解作用域，可能混淆同名变量	完全理解作用域，识别真正的函数调用关系
准确性	低，噪音多，需要AI二次筛选	高，结果精准，无需额外判断
消耗的Token	极高，需要处理大量无关结果	较低，只处理精确的、有意义的信息

2.示例

安装语言服务器 + 对应claude code插件，以TypeScript项目为例

在终端中运行

js 复制代码

npm install -g typescript-language-server typescript

typescript-language-server：负责理解代码语法、提供类型信息、查找引用等，是一个独立的引擎。

在claude中运行

js 复制代码

/plugin install typescript-lsp

typescript-lsp：告诉 Claude Code 如何启动并连接 typescript-language-server。

安装LSP之前，查询一个函数大约花费0.4319刀

安装LSP之后，查询同一个函数大约花费0.2137刀。input的token量从58.8K降到29.9k

4.启用计划模式

对于小需求，使用 /plan 开启计划模式；对于中大型需求，使用Superpowers插件；做到先规划后执行，减少试错。

plan模式：Claude Code 会安全地探索代码库、构思解决方案并制定详细的实施计划，而不会触碰或修改任何文件。

Superpowers 的核心理念是通过一套标准化的工作流程，引导 AI 在动手写代码之前，先进行需求澄清、方案设计和测试用例编写，从而减少因规划不足导致的返工和混乱

Superpowers 的核心由以下三个核心技能组成：


技能命令	阶段目标	工作流中的角色与行为
brainstorming	需求分析与设计	强制Claude先进行多轮对话，通过提问来彻底理解你的需求，评估不同方案的优劣，并对齐双方的认知。最终会将讨论结果整理并保存到 docs/plans/ 目录下。
writing-plan	制定开发计划	当需求确认后，Claude会基于设计方案，将复杂的开发任务拆解为一系列独立、细粒度（如2-5分钟可完成）的实施步骤，并为每步设定清晰的验证标准。
execute-plan	执行计划（含TDD）	开始逐项执行开发计划。在这个阶段，它会采用测试驱动开发（TDD）模式：1. RED: 先写一个必然失败的测试。2. GREEN: 编写刚好能让测试通过的代码。3. REFACTOR: 在测试保护下优化代码**。完成一项后，会等待你确认再进入下一步。

5. 管理规则

1.全局规则 CLAUDE.md

使用 /init 命令能够快捷创建CLAUDE.md文件

CLAUDE.md 是 Claude Code 的"项目记忆文件"，记录项目结构、构建命令、代码规范、架构决策等信息，让 Claude Code 快速理解项目上下文

可将项目通用规则放在 CLAUDE.md 中，以提供持久上下文

但也要注意，CLAUDE.md 如果内容过长，反而会消耗大量token。将 CLAUDE.md 控制在 200 行以内是性能与成本的最佳平衡点。

对于单体大仓库，全局的 CLAUDE.md（控制在200行以内）往往是不够用的，因此还需要借助作用域规则

2.路径规则 (.claude/rules/)

当访问特定目录下的文件，才会加载的规则。项目目录结构

js 复制代码

your-project/
├── .claude/
│   └── rules/
│       ├── code-style.md  # 编码风格规则 (通用)
│       ├── testing.md     # 测试规则 (通用)
│       └── api-rules.md   # API 开发规范 (仅作用于特定路径)

例如只希望 AI 在处理 src/service/** 目录下的文件时，遵循 API 开发规范。可以创建 .claude/rules/api-rules.md 文件

js 复制代码

---
paths:
  - 'src/service/**/*.ts'
name: API开发规范
description: 项目API层的编码与安全标准
---

# API开发规则

1.  **必须** 使用 TypeScript 严格模式 (`"strict": true`)。
2.  **必须** 为所有 API 添加中文注释。

保存文件后，重启claude code，提问：你知道我们项目的 API 开发规范吗？

再让AI去按照规则去修改，提问：按照api规则帮我重构对应文件。

AI会将service文件夹下的函数或类型接口等都添加了中文注释

6. 数据预处理

利用 PreToolUse 钩子（类似于请求拦截器），在 Claude 执行操作前，对输入的数据进行处理、压缩，从而达到减小token使用量。

示例：使用 rtk

rtk会拦截并重写 Bash 命令的输出，比如 git diff 只展示文件差异的核心摘要。

1.rtk安装（Windows）

1.访问 github.com/rtk-ai/rtk/...

2.在页面中找到类似 rtk-x86_64-pc-windows-msvc.zip 的文件，下载到本地

3.将下载的压缩包解压，放在一个你方便管理的专属文件夹，例如 D:\Develop\rtk

4.在用户变量和系统变量列表中找到 Path，选中后点击编辑，新增 D:\Develop\rtk

5.重启 PowerShell 或 CMD 终端，运行

js 复制代码

rtk --version

如果有版本号，说明安装成功

2.配置到claude

在 PowerShell 或 CMD 终端中运行

js 复制代码

rtk init --global

安装成功后，在claude中运行 /hooks，可以看到 rtk 已安装在PreToolUse中

我本地修改了一些文件，然后运行

js 复制代码

git diff | claude -p "解释这些更改"

安装 rtk 之前的token消耗大约0.0970刀

安装 rtk 之后的token消耗大约0.0542刀，input的token量从13.2k降到了3.5k

提示：除了使用 git 命令，使用 cat / read 命令去读文件内容时，也能大幅度减小input输入量

7.自动化内存管理

Claude Code 默认是自动开启Auto Memory 功能，该功能会自动保存跨会话的学习心得，如构建命令、调试经验等。

这个"笔记本"在每个项目中都有自己独立的文件夹。文件路径：~/.claude/projects/<项目名>/memory/

需要定期清理已过时或不再准确的偏好设置，否则每次会话都会加载

8.生成.claudeignore

配置之后，大模型在上下文分析和代码搜索时不会自动包含它们

可让AI直接生成一份配置文件：创建一个 .claudeignore 文件，帮我排除掉不必要的目录，比如 node_modules

结尾

如果有更多可以节省token的方案，可以在评论区留言，文章会定期更新！

创作不易，欢迎点赞支持！！！