AI Coding 最大的 token 黑洞，可能根本不是 prompt

moshuying2026-05-19 22:02

我最近才意识到：

AI Coding 最大的 token 黑洞，可能根本不是 prompt。

而是 shell output。

Claude Code / Cursor 在长时间 agent session 里，会不断读取：

这些 CLI 输出很多都是"人类都不会认真看"的噪音，但模型会把它们重新塞进 context。

结果就是：

你在花钱让 LLM 重复阅读终端垃圾信息。

最近看到一个很有意思的项目：

lean-ctx（GitHub 已经 1.7k⭐）

它做的事情其实很简单：

在 AI Agent 和代码仓库之间加一层 context optimization。

核心包括：

• 压缩 shell 输出

• AST / Tree-sitter 分析代码结构

• 缓存重复上下文

• 只给模型真正相关的代码片段

官方数据里提到：

但我觉得最有意思的不是"压缩文件读取"。

而是：

它终于开始优化 CLI output 了。

现在很多 AI Coding 工具都在做 RAG、memory、prompt engineering。

但真正疯狂烧 token 的，

往往是那些没人关注的终端日志。

AI Coding 下一阶段，

可能已经不是 "更强模型" 竞争了。

而是：

谁能更高效地管理 context。