Claude Sonnet 5 上线：别再让 Claude Code 一律烧 Opus

6 月 30 日，Anthropic 发布 Claude Sonnet 5。

如果你平时用 Claude Code，这条消息不应该只理解成"又来了一个更强模型"。

它真正影响的是一个更具体的团队决策：以后 Claude Code 到底什么时候用 Sonnet，什么时候用 Opus，什么时候必须让人接管？

我的判断很直接：

不要全员默认 Opus。

也不要一听 Sonnet 5 便宜、上下文长，就把所有 Agent 任务都切过去。

更稳的做法，是给 Claude Code 建一张模型路由表：日常修 bug、补测试、解释模块，让 Sonnet 5 先跑；跨模块重构、权限逻辑、安全边界、生产事故，保留 Opus 或人工主导。

这篇不做"Sonnet 5 是否秒杀 Opus"的标题党。它更像一张团队迁移清单：如果你准备把 Claude Code 更深地放进开发流程，先把这 5 件事想明白。

新模型上线，最先要改的是默认思路

官方文档里，Sonnet 5 的定位很清楚：这是面向多数开发任务的主力模型，支持 1M context，最大输出 128K token，并且在 8 月 31 日前有一段限时价格。

同一份模型文档里，Opus 4.8 仍然被放在复杂推理和 agentic coding 场景里。

这说明一个现实问题：

Claude Code 不是只能选"最强模型"。

它更像一个工具调度器。

一个任务只改 Controller 参数校验，让 Opus 全仓扫描，可能是浪费。

一个任务要动权限模型、数据迁移、异步任务、支付链路，让 Sonnet 直接大改，又可能是冒险。

以前很多团队的做法太粗：

预算紧，就全用便宜模型。

风险高，就全开最强模型。

但 AI 编程真正进入团队以后，这两个策略都会出问题。

前者容易把复杂任务交给不该独立做决定的模型。

后者会把大量日常任务变成高成本后台消耗。

Claude Code 应该有模型路由，不是模型信仰

我建议团队把 Claude Code 的任务先分成五类。

第一类，解释型任务。

比如读一个旧模块、梳理调用链、解释为什么某个接口会报错、整理测试入口。

这类任务优先给 Sonnet 5。它的价值是快速把上下文摊开，让人少花半天找入口。

第二类，小步修复。

比如参数校验、空指针、异常文案、单测补齐、小范围前端交互。

这类任务也可以先给 Sonnet 5，但要限制 diff 范围，要求输出测试证据。

第三类，跨文件改造。

比如新增接口、改领域对象、改缓存逻辑、改定时任务、改一段被多人复用的 service。

这里不能只看模型能力，要看 reviewer 成本。Sonnet 可以起草方案和小步补丁，但关键决策要让人确认。

第四类，高风险边界。

权限、密钥、生产配置、CI/CD、数据迁移、支付、审计、风控、安全策略。

这类任务不要交给"默认模型自动完成"。可以让 Opus 做方案推演，也可以让 Sonnet 做只读分析，但最终必须人工主导。

第五类，事故和线上问题。

这类任务最忌讳 Agent 自信地边猜边改。

模型可以帮你读日志、列假设、生成回滚检查单，但不要让它在没有边界的情况下直接改生产相关代码。

成本不能只看每百万 token 的价格

Sonnet 5 的价格优势会让很多团队心动。

但 AI 编程成本不是模型单价乘以 token 数这么简单。

真正要算的是三笔账：

生成成本。

返工成本。

Reviewer 成本。

如果一个任务 Sonnet 5 生成很快，但改动范围失控，reviewer 看半小时还不敢合并，它就不便宜。

如果一个任务 Opus 一次跑完，但输出了过度设计、无关重构、复杂测试环境要求，它也不一定划算。

团队真正应该记录的是：

这个任务花了多少轮对话？

改了多少文件？

人类 reviewer 花了多久？

测试有没有一次跑通？

有没有因为 AI 输出引入二次返工？

一周之后，你会发现模型路由不是拍脑袋决定的。

有些仓库、任务、语言栈确实适合 Sonnet 5 做主力。

有些核心模块即使用 Opus，也必须先让人拆任务和定验收。

升级前，先跑一周真实任务板

如果团队准备把 Claude Code 默认模型调整到 Sonnet 5，我建议不要开会争论。

直接拿一周真实任务跑一张测试板。

选 6 类任务：

一个老接口 bug。

一个单测补齐。

一个小型前端改动。

一个跨 service 的后端需求。

一个安全或权限相关分析。

一个 PR review 自查。

每个任务只记录 5 个结果：

是否完成。

改动是否收敛。

测试证据是否可用。

reviewer 返工多久。

是否需要切换到 Opus 或人工接管。

这张表跑完，比任何"模型很强"的评价都有用。

它会告诉你：Sonnet 5 在你们项目里能不能当默认工作马，Opus 应该保留在哪些关口，哪些任务根本不该让 Agent 自动改。

模型变强，不代表权限也要变大

很多团队升级模型时，只盯能力，不改权限。

这是最危险的地方。

模型越强，越应该收紧默认权限。

Claude Code 官方文档本来就支持模型配置、权限配置和允许模型列表。团队可以把这些东西当成工程控制面，而不是个人偏好。

我的建议是：

Sonnet 5 默认只做低风险开发任务。

跨模块修改必须先出方案，再小步 patch。

Opus 用在复杂方案、架构推演、疑难问题复盘，不要默认拿来扫所有日常任务。

高风险目录和生产配置，默认禁止 AI 修改。

PR 里必须写清楚使用了哪个模型、做了哪部分、人工复核到哪一步。

这不是给 AI 降速。

这是让 AI 的速度能进团队流程。

没有路由，没有权限，没有证据，Claude Code 再强也只是个人玩具。

有了路由、权限和验收，它才可能变成团队基础设施。

最后的判断

Claude Sonnet 5 的重点，不是让程序员又多背一个模型名字。

它更像一次提醒：

AI 编程工具已经进入"模型调度"阶段。

以后团队不只要回答"用不用 Claude Code"。

还要回答：

什么任务用 Sonnet？

什么任务用 Opus？

什么任务只读分析？

什么任务必须人工接管？

什么任务不允许 AI 碰？

如果你现在还只会在设置里选一个默认模型，接下来很容易遇到两个问题：

要么为了省钱，把复杂任务交给便宜模型硬跑。

要么为了省心，把日常任务全交给贵模型硬烧。

这两种都不是成熟团队的用法。

成熟用法是：让模型按任务分工，让权限按风险分级，让 PR 按证据验收。

下一篇 AI 工具实验室，我更想做一个实际对比：同一个 Java 接口改造任务，让 Claude Code 的 Sonnet / Opus 路由、Codex、Cursor 各跑一遍，直接看谁的返工最少。