Claude Code 上下文管理:rewind compact subagent怎么选

Claude Code 的上下文窗口刚扩展到了 100 万 token,但很多人还在用 20 万时代的老习惯操作------该用 rewind 的时候用纠错,该起子 Agent 的时候死撑一个 session。这篇文章来自 Claude Code 团队负责人 Thariq,把 session 管理的核心技巧说清楚了。

什么是 Context Rot(上下文腐烂)

用过 Claude Code 的人都遇到过这种感觉:聊了很长一段时间之后,模型开始变笨------明明之前理解的东西,现在却绕来绕去。

这不是错觉,有个专门的名词叫 Context Rot(上下文腐烂)。

原理很简单:模型的注意力是有限的,上下文越长,注意力就越分散到那些早就过时的内容上------之前试过但失败的方向、已经不相关的调试信息、废弃的讨论。这些内容不会消失,一直占着位置,干扰模型对当前任务的判断。

Claude Code 的上下文窗口是 100 万 token,但「能放」不等于「该放」。窗口越大,context rot 带来的问题就越需要主动管理。

每次回复之后,你有 5 个选择

Claude 完成一轮任务之后,大多数人直接继续发消息。但 Thariq 指出这个节点实际上有 5 个选项:

  • 继续 --- 同一 session 接着来
  • /rewind(Esc Esc)--- 回到某条消息重新开始
  • /clear --- 清空 session,写一段手动整理的 brief 开新局
  • /compact --- 让模型总结上下文,压缩后继续
  • Subagents --- 把下一块工作分给子 Agent,只把结果拿回来

后四个选项都是为了对抗 context rot,只是适用场景不同。

什么时候开新 Session

原则只有一条:新任务,新 session

100 万 token 让一些大任务变得可行了------比如从零开始搭一个全栈应用、完整重构一个模块。这类任务可以在一个 session 里跑完。

但有个常见误区:任务结束了,紧接着做关联性工作(比如刚写完功能,马上写这个功能的文档),觉得上下文有用就懒得开新 session。

Thariq 的建议是:关联任务用不用开新 session,取决于「Claude 需不需要重新读那些文件」。如果上下文里已经有了刚才操作过的文件内容,留着是合理的;如果已经是一堆无关的调试历史,开新 session 更干净。

Rewind:最被低估的功能

Thariq 说了一句很直接的话:会不会用 rewind,是判断一个人 session 管理水平的标志。

场景:Claude 读了五个文件,尝试了某个实现方向,失败了。你的第一反应可能是直接打「这个方法不行,换个思路」。

但更聪明的做法是:esc esc 回到文件读完之后那条消息,带着刚才学到的教训重新 prompt

别用 A 方案,foo 模块没有暴露那个接口------直接走 B。

效果的区别一目了然:

继续纠错会把「失败的尝试」全程保留在上下文里;rewind 把那段历史删掉,拿着干净的上下文重新出发。

还有一个配合用法:先让 Claude「从这里总结一条交接消息」,把有用的信息提炼出来,复制好,然后再 esc esc 回到之前的节点,把那句总结粘贴进 prompt 重来。

Compact vs. 手动 Clear,两种策略

session 时间长了,有两种减负方式,选哪个取决于你愿意花多少精力:

/compact :让模型自己总结对话,用摘要替换历史记录。省力,但是有损压缩------模型决定什么重要,什么被丢掉。可以加指令控制方向,比如 /compact 聚焦 auth 重构,丢掉测试调试的部分

/clear:你手动写一段 brief,清空 session 重头开始。费力,但结果是你决定的上下文------「我们在重构 auth 中间件,约束是 X,关键文件是 A 和 B,已经排除了方案 Y」。

什么时候 compact 会翻车?

一个典型场景:长时间调试之后,autocompact 触发,把调试过程压缩了。但下一条消息是「去修一下 bar.ts 里的那个 warning」------因为 session 重心在调试,那个 warning 可能根本没进摘要。

规律就是:context rot 最严重的时候,恰好也是模型判断力最差的时候 ,这时候的自动 compact 质量往往不理想。有了 100 万 token,可以更早触发 /compact,主动给它一个方向,别等到被动触发。

Subagents 不是拿来并行的

很多人把 Subagents 理解成「并行干活的工具」,但 Thariq 给了一个更清晰的定位:Subagents 是一种上下文管理策略

判断标准只有一个问题:这块工作产生的中间过程,我之后还需要吗?还是只需要最终结果?

如果只需要结果,交给 Subagent------它在自己独立的 100 万 token 里折腾,把总结交回来,主 session 的上下文完全不受影响。

几个实际用法:

"起一个 subagent,根据这个 spec 文件验证一下刚才的实现"
"起一个 subagent,读一下那个 codebase 里的 auth 实现方式,然后你按同样的方式在这里实现"
"起一个 subagent,根据 git 变更写这个功能的文档"

本质上是把「只需要结论、不需要过程」的工作隔离出去,保持主 session 的上下文质量。

一句话总结

有用留着,没用砍掉。

不同情境下怎么选,Thariq 做了一张决策表:

100 万 token 是更大的操作空间,不是「可以不管上下文」的借口。管好上下文,模型就一直好用;任由 context rot 积累,窗口再大也没用。

🦞 想和一群 AI 玩家一起交流实战经验?

在公众号对话框回复「小龙虾 」,加入龙虾养成群------一个专注 AI 工具提效、工作流搭建、自动化实操的交流社群。

只聊 AI 实战干货,一起玩转效率工具 👇

参考链接

相关推荐
永霖光电_UVLED2 小时前
AIXTRON(爱思强)于2026年的业务指引实现上调
大数据·人工智能
云起SAAS2 小时前
AI词元理财系统完整源码 | 多级分销返利+虚拟挖矿+复利投资 | Vue3前后端分离
人工智能·广告联盟·看广告变现轻·看广告激励积分兑换系统app·ai词元理财系统完整源码
m0_694845572 小时前
VoxCPM部署教程:构建AI语音交互系统
服务器·人工智能·后端·自动化
eastyuxiao2 小时前
多机 OpenClaw 互联完整方案
人工智能·架构
YuanDaima20482 小时前
队列与单调队列基础原理与题目说明
人工智能·python·算法·leetcode·队列·手撕代码
企微增长观察2 小时前
企业微信怎么注册?2026年完整注册流程
java·人工智能·企业微信
东离与糖宝2 小时前
Python 生成器基础:yield 核心原理
人工智能
AI2512242 小时前
AI文生视频技术解析:主流工具的模型架构与能力对比
人工智能·架构·音视频
pen-ai2 小时前
IRLS(迭代加权最小二乘)详解:基于 Huber Loss 的鲁棒回归
人工智能·数据挖掘·回归