Claude Sonnet 5 来了：Opus 级的能力，Sonnet 的价

Anthropic 昨天发布了 Claude Sonnet 5。一句话概括：把接近 Opus 4.8 的 agentic 能力，压到了 Sonnet 的价位。它已经是 Free 和 Pro 的默认模型，Claude Code 里直接能用。

我对着官方公告逐条读了一遍，把「强在哪、贵不贵、日常要不要换」讲清楚。涉及具体数字的地方，我只写官方明确给出的，benchmark 的精确分数在系统卡里，我不替它编。

一、它到底强在哪：能自己把活干完

官方给 Sonnet 5 的定位是「至今最 agentic 的 Sonnet」------能做计划、用工具（浏览器、终端），自主跑到几个月前还得靠更大更贵的模型才能到的水平。

比起前代 Sonnet 4.6，它在推理、工具使用、编码、知识工作这几块都有明显提升。更关键的是那个「gap」：它的表现接近 Opus 4.8，但价格低一截。

早期合作方的反馈很一致，都指向同一件事------它能把活干完，而不是干到一半停下。几个具体场景：

这几个描述放一起，指向的是同一种变化：它更能沿着计划走、自己检查输出，而不用你一步步盯。

介绍价：每百万输入 token 2 美元、输出 10 美元，到 2026 年 8 月 31 日。之后转标准价：输入 3 美元、输出 15 美元。

看着比 Opus 便宜很多。但有个必须说清楚的细节：Sonnet 5 换了新的分词器（和 Opus 4.7 那次一样）。同样一段内容，会被切成更多 token，大概 1.0 到 1.35 倍，看内容类型。

官方把介绍价定得刚好抵消这个变化，说从 4.6 换到 5 的过渡「大致成本持平」。所以别把「单价低」直接理解成「花得少一半」------单价是降了，但每次调用吃的 token 变多了，两头一抵，日常成本更接近持平，不是腰斩。这点得心里有数。

Sonnet 5 支持调 effort（努力档位）。官方的说法是：它覆盖的成本-性能范围比 Opus 4.8 更宽。

换句话说，以前你可能为了「干得动」直接上 Opus，现在很多情况可以用 Sonnet 5 调高 effort 顶上去，成本更可控。真需要最强推理的硬骨头再上 Opus。这是个能省钱的选择点。

它是 Free 和 Pro 的默认模型，也进了 Claude Code 和 Claude Platform，API 名就是 claude-sonnet-5。

对平时一个人写代码的人，最实际的影响是：默认款直接升了一档。你不用特意切模型，日常那些多步骤的活------改一个跨文件的功能、追一个 bug、跑一轮 PR review------主力款就能更稳地跑完。以前动不动想上 Opus 的场景，会少一些。

官方的安全评估里，Sonnet 5 整体比 4.6 更好：更能拒绝恶意请求、更抗 prompt injection 劫持，幻觉和谄媚都更低。这些对 agentic 场景是实打实的加分。

但也有得说清楚的：

完整评估在官方的 Claude Sonnet 5 System Card 里，具体 benchmark 分数以那份为准。

这次发布真正的信号，不在某个 benchmark 涨了几个点，而在 agentic 能力在往下沉------那种「能自己把多步任务跑完、跑完还自查」的本事，正从最贵的旗舰款，下放到你天天在用的主力款。

对多数人，日常那点活，主力款就够使了。把 Opus 留给真正难的，Sonnet 5 顶大部分。

参考：Anthropic 官方公告 anthropic.com/news/claude-sonnet-5（含 System Card）。