
按技术原理 + 作用环节 + 适用场景 重新归类,覆盖官方 / 第三方 / 开源 / IDE/CLI/ 浏览器 / 代理 全品类,标注节省比例、核心工具、最佳实践,便于直接选型。
一、上下文瘦身 / 过滤类(输入侧,最通用)
核心逻辑:剔除冗余、只传必要内容,减少单次输入 Token
- 节省比例:30%--98%
- 代表工具
- Claude Context:自动过滤无用文件 / 依赖,保留核心代码上下文(30%--50%)
- RTK (Rust Token Killer):CLI 输出压缩,去 ANSI / 重复行 / 日志(60%--90%)
- Context Mode:CLI 输出沙盒化,存入 SQLite 而非上下文(98%)
- Claude Code(内置) :
.claudeignore+ 自动压缩(30%--60%) - Token Optimizer:清理 "幽灵 Token"、不可见冗余(40%--60%)
- 适用:日常编码、终端交互、单文件 / 小模块开发
二、结构化压缩 / 代码图谱类(大型项目最强)
核心逻辑 :将代码 / 项目转为摘要 / 图谱 / 符号,用极小 Token 表达结构
- 节省比例:40%--100 倍(最高 99%)
- 代表工具
- code-review-graph:代码依赖→结构图谱,审查 / 架构场景(6--100 倍)
- Token Savior:符号 ID 替代大文件,代码导航(97%)
- Omni:语义蒸馏 + 代码图谱,长上下文压缩(90%)
- SWE-Pruner:AI 代理专用,自适应剪枝(40%)
- 适用:大型项目、代码审查、架构分析、AI 代理
三、记忆 / 持久化 / 复用类(长期开发最优)
核心逻辑:一次压缩、永久复用,避免重复注入全量上下文
- 节省比例:80%--96%
- 代表工具
- Claude-Mem / Claude Men:三层渐进检索 + 向量存储,跨会话记忆(80%--95%)
- Open Viking:文件系统范式 + 分级加载,Agent 任务(96%)
- TRAE(记忆层):本地记忆 + 精准检索,多轮对话(70%--90%)
- 适用:长周期开发、跨会话、高频重复查询、复杂 Agent
四、Prompt 缓存 / 复用类(重复请求省最多)
核心逻辑:缓存固定前缀 / 相似请求,重复调用 0 成本或折扣
- 节省比例:60%--90%
- 代表工具
- Anthropic Prompt Caching(官方):缓存 System Prompt/Tools,缓存部分 90% 折扣
- PromptCache:语义压缩 + 智能缓存,相似请求 0 调用(87%+)
- 趋境 ATaaS KV Cache:超体量缓存,命中率 90%+(90%)
- 适用:API 批量调用、固定流程、重复查询
五、输出压缩 / 精简类(输出侧,立竿见影)
核心逻辑:强制模型极简输出,砍掉废话 / 冗余解释
- 节省比例:14%--75%
- 代表工具
- Caveman Claude:"原始人" 人设,强制短句输出(65%--75%)
- Claude Code(Auto-Compact):旧对话自动压缩为摘要(30%--50%)
- Qoder:过滤冗余输出、只留核心结果(40%--60%)
- 适用:所有对话场景、代码生成 / 审查
六、代理 / 模型路由 / 成本优化类(整体成本降维)
核心逻辑:按任务选模型、用低价替代、减少无效调用
- 节省比例:30%--100 倍
- 代表工具
- TRAE:代理编排 + 模型路由,轻量模型做意图分类(30%--70%)
- OpenClaw:中转服务,成本压至官方 1/10(90%)
- Claude Proxy:Claude Code 兼容低价 OpenAI 模型(80%+)
- Claude Code(模型切换):按任务用 Haiku/Sonnet/Opus(30%--80%)
- 适用:多模型混合、Agent 开发、高成本 API 场景
七、浏览器 / 网页优化类(网页场景神器)
核心逻辑:用元素 ID 替代完整 DOM,大幅减少网页上下文
- 节省比例:93%
- 代表工具
- agent-browser(Vercel Labs):DOM 元素编号,用 click@e1 替代 HTML(93%)
- 适用:网页自动化、爬虫、前端开发
八、IDE / 编辑器内置优化(零配置即用)
核心逻辑:编辑器原生集成,自动压缩 / 增量 / 缓存
- 节省比例:30%--70%
- 代表工具
- 腾讯云 CodeBuddy:Prompt 缓存 + 自动压缩(30%--60%)
- Windsurf(Codeium):不限量订阅 + 语义压缩(零 Token 焦虑)
- VTJ.PRO:增量 diff 更新,只传变更(70%)
- 适用:日常 IDE 开发、Cursor/Claude Code 用户
九、工具选型总表(按场景一眼选)
表格
| 分类 | 核心价值 | 节省比例 | 首选工具组合 | 最佳场景 |
|---|---|---|---|---|
| 上下文瘦身 | 去噪、只传必要 | 30%--98% | Claude Context + RTK | 日常编码、终端 |
| 结构化压缩 | 代码→图谱,极致压缩 | 40%--100 倍 | code-review-graph + Token Savior | 大型项目、审查 |
| 记忆复用 | 跨会话、不重复注入 | 80%--96% | Claude-Mem + Open Viking | 长周期、Agent |
| Prompt 缓存 | 重复请求 0 成本 | 60%--90% | Anthropic 缓存 + PromptCache | API 批量调用 |
| 输出精简 | 砍废话、极简回复 | 14%--75% | Caveman Claude + Auto-Compact | 所有对话 |
| 代理路由 | 成本降维、模型分级 | 30%--100 倍 | TRAE + OpenClaw | 多模型、高成本 |
| 浏览器优化 | DOM→元素 ID | 93% | agent-browser | 网页自动化 |
| IDE 内置 | 零配置、自动优化 | 30%--70% | CodeBuddy + Windsurf | 日常 IDE 开发 |
十、实战组合建议(最高性价比)
- 个人开发者(Claude Code) :RTK + Claude-Mem + Caveman Claude → 省 80%+
- 大型项目 / 团队 :code-review-graph + Claude Context + Prompt 缓存 → 省 90%+
- AI Agent 开发 :TRAE + Open Viking + SWE-Pruner → 省 95%+
- 网页 / 前端 :agent-browser + Claude Code 内置 → 省 93%+