当你的 AI 使用强度较高时,经常会遇到额度不够用的情况。这里系统地提供一些解决思路。
各项方案可同时采用、叠加使用,效果更佳。
使用技巧层面
及时开启新会话
大模型本身是无状态的,每次问答都会将完整的历史会话重新输入模型。多轮交互后,上下文会急剧膨胀,不仅消耗等量的 Token,还可能触及上下文长度限制。
因此,建议在以下两种情形下主动开启新会话:一是当前任务告一段落时,二是开始一个与前文无关的新任务时。
若当前上下文已接近长度限制,而任务尚未完成,可先让当前会话生成一份精简的交接摘要,内容应涵盖:目标、已完成事项、关键文件、未决问题及验证命令。随后在新会话中凭此摘要继续推进。
此外,过长的上下文还会导致模型注意力"塌陷"(模型忽略关键信息),使生成质量下降。及时开启新会话,还能够保持上下文轻便、干净,有助于提升 AI 的输出质量。
生成交接摘要的解决方案
- 方案一: 让 AI 直接生成
在目标会话中,直接要求 AI 生成交接摘要。示例提示词如下。
skill
请把当前会话压缩成一份可交接给新会话继续执行的摘要。
不要写推理过程,不要复述无关内容,不要虚构信息,不确定处标注"待确认",敏感信息脱敏。
请包含:
1. 目标
2. 已完成事项
3. 关键上下文/约束/决策
4. 关键文件、路径和当前状态
5. 未决问题
6. 下一步行动
7. 验证命令
8. 可直接复制到新会话的启动提示词
- 方案二:使用handoff摘要 skill
跨智能体/会话交接属于典型场景,业界已提供多款相关 Skill 可供选用。这里推荐安装使用 mattpocock/handoff。
先缩小问题,再调用模型
高消耗常常不是模型贵,而是输入过多。
-
只提供相关文件、相关函数和报错片段;大日志只截取错误附近内容。
-
明确任务边界:目标、非目标、验收条件、允许修改的文件。
-
要求模型先给"计划 + 涉及文件清单",确认后再执行复杂改动。
-
避免"帮我看看整个项目""优化一下所有代码"这类没有边界的请求。
模型与Agent层面
建立任务分级,多模型配合使用
把高阶模型留给"需要判断"的任务,把低成本模型留给"规则明确、可验证"的任务。按任务类型切换适合的模型。
| 任务类型 | 推荐通道 |
|---|---|
| 架构设计、陌生代码库、多文件复杂改动、顽固 Debug | GPT-5.5 / 高阶 Codex |
| 明确的小功能、单文件修改、测试补齐、常规重构 | GPT-5.4 mini 或其他性价比较高的模型 |
| 信息检索、需求拆解、生成草稿、代码解释、初步方案、已有明确方案后的批量执行 | 国产模型或低成本模型 |
GPT 5.5 与 5.4 的定价差有 2.5 倍,模型切换效果显著。

合理的Agent配置
以 Codex为例,它的"推理"和"速度"配置对 Token消耗影响巨大,建议根据任务类型动态切换。

推理程度越高,模型通常会投入更多推理与探索,并可能产生更长的输出、更多工具调用和重试,因此实际 token 消耗往往更高。
工具层面
Headroom
Headroom(上下文压缩工具),据官方数据,可节省 60%--95% 的 Token 消耗。

只需一行命令即可完成安装,详细步骤与命令可参考 github.com/headroomlab... 或 dashen-tech.com/dev-tools/h...。
下面是一些经验总结
-
常用命令
-
启用(以 Codex 为例):
headroom wrap codex -
关闭:
headroom unwrap codex -
查看统计与节省情况:
headroom perf
-
-
执行
wrap命令后,Headroom 会自动启用 Agent 的 CLI 模式。如果您使用的是客户端或编辑器插件,看到8787端口服务启动成功后,关闭命令行,即可在客户端或插件中正常使用。原因是 Headroom 修改的是 Agent 的全局配置, CLI 和客户端/插件会同时生效。 -
开启 Headroom 后,之前的历史会话将暂时不可见,这相当于切换了登录方式;执行
unwrap后,原有会话会自动恢复。 -
Headroom 会自动安装并使用
rtk和serena。其中,rtk用于命令压缩,serena是一个 MCP 工具,用于理解代码库并保存项目记忆。
codebase-memory-mcp
codebase-memory-mcp 是一个MCP 服务,为 AI 提供对代码库的快速、结构化理解。能让 AI 能像人一样"记住"并理解整个代码库的结构,而不是每次都要从头开始逐文件搜索, 官方宣称能省 120 倍的 tokens。
安装与使用步骤:
-
系统全局安装
plaintextnpm install -g codebase-memory-mcp -
配置mcp到你的 Agent工具
plaintextcodebase-memory-mcp install -
使用
重启你的Agent,切换到目标项目,说"索引这个项目"。
skill
Index this project