Vibe Check:Claude Sonnet 4.5

转载

比 GPT-5 Codex 更快,比 Opus 4.1 更聪明、更可控

2025 年 9 月 29 日

作者:Dan Shipper


Anthropic 刚刚发布了 Claude Sonnet 4.5。当然,我们整个周末都在用它写代码和跑长链路的 agentic 任务。

结论: 它比 Opus 4.1 明显更快、更可控、更稳定------尤其是在 Claude Code 中。实测对比中,它几分钟就完成了一个大型 PR 的代码审查,能处理多文件推理而不跑偏,而且当我们要求它保持简洁时,它真的做到了。

它还不会取代 GPT-5 Codex 处理最棘手的线上生产级 bug,但作为日常开发工具,它感觉是一次令人兴奋的飞跃。以下是我们的第一天使用体验。


速度

如果你习惯在 Claude Code 或 Claude app 中用 Opus,你会很高兴:新版本 Sonnet 4.5 非常快。

Cora 总经理 Kieran Klaassen 说:"感觉比之前的 Claude 快了大概 50%。"

在一次正面对比的代码审查挑战里,它在约 2 分钟 内完成了一个大型新功能的全面代码审查。而 GPT-5 Codex 则花了约 10 分钟才做完同样的任务。

速度本身就是智能的一种维度,Sonnet 4.5 的速度让它更容易成为你的结对编程伙伴。


表现

它在 Claude app 和 Claude Code 里执行长时间运行的 agentic 任务表现相当好。

我给它输入了我们公司 Every 的三张表格:损益表、周度绩效追踪表、咨询业务追踪表------它轻松就写出了一个三季度投资人更新文档,我几乎可以不改直接发出去。

Kieran 发现,它在大约 20 分钟内解决了一个 Opus 4.1 完全解决不了的 bug。他甚至直接用它 vibe code 出了一款 Cora 的 iOS 应用:把现有代码库和一本 iOS 编程书一起喂给 Sonnet 4.5。

这一性能提升主要来自几个方面:

  • 更好的可控性:能更好地遵循提示指令,感觉更像 GPT-5 Codex,不会像旧版 Claude 那样太"热心"。
  • 大上下文处理能力:在大代码库里不容易迷失,能抓住长提示中的重点。
  • 更确定性:在相同提示下,更可能多次给出一致结果。这种可预测性提升了实用性。
  • 更专注、简洁:Kieran 注意到,Anthropic 明显向 GPT-5 学习了。新版 Sonnet 4.5 会直接告诉你需要的东西,不再东拉西扯,交互效率高得多。

但有一个例外:在复杂生产环境下的困难 bug 任务上,GPT-5 Codex 依然更胜一筹。我让 Sonnet 审查一个大型 PR 时,它完成得更快------但 GPT-5 Codex 抓住了一个难以发现的边界情况,而 Sonnet 漏掉了。


Reach Test:我们每天都会用它吗?

一个 AI 产品长期有用的最好指标,就是我们所谓的 Reach Test:你是否会下意识地每天拿它来做一些任务?还是它会被束之高阁?

  • Dan:不会
    我的日常驱动仍然是 ChatGPT 和 Codex CLI。
    不过,如果要用 Claude,我会选它而不是 Opus 4.1。
    对日常场景来说,很难超过 ChatGPT 的 GPT-5 速度。
    对编程场景来说,我更信任 GPT-5 Codex,尤其是我现在主要在陌生的大代码库里开发新功能(比如为 Cora 写功能)。GPT-5 Codex 让我更安心,不至于提交尴尬的 PR。
  • Kieran:会
    对他来说,Sonnet 4.5 搭配 Claude Code 几乎无敌。
    "Claude Code 就像一个编程了 20 年的聪明人,"相比之下,Opus 4.1 像个博士,而 GPT-5 Codex 则像"一个脾气暴躁的资深工程师"。
    Claude Code 的 CLI 功能比 Codex CLI 更全面,Sonnet 4.5 可以把它的潜力发挥到最大:它擅长后台任务,比如跑服务器、协调多个并行子 agent(这是 Codex 目前还不支持的)。
  • Alex:会
    他会选择在 Claude Code 中使用 Sonnet 4.5,而不是 Opus 4.1。Claude Code 仍然是他相较于 Codex CLI 的日常驱动工具。

最终结论

如果你每天用 Claude Code 编程,那么 Sonnet 4.5 就是你的新最佳拍档。它比 Opus 4.1 更快、更稳定、更可控。

如果你已经是 GPT-5 Codex 的忠实粉丝,Sonnet 4.5 不会让你立刻切换------但它值得在新项目、vibe coding,以及需要 Claude 独特"勤快 + 速度"组合的任务里尝试。

截至发布时,Sonnet 4.5 的定价还未公布,但如果和 Sonnet 4 保持一致------每百万输入 token 3 美元------那么迁移任何现有基于 Opus 的 API 任务都毫无障碍。Opus 4.1 的价格是它的 5 倍,而 Sonnet 4.5 还更快更聪明。不过,GPT-5 依然便宜很多。

相关推荐
Jagger_14 小时前
掌握WBS:提升项目管理效率的实用指南
aigc·openai·ai编程
AI炼金师17 小时前
GPT-5-Codex Prompting Guide|提示词指南
aigc·ai编程·极限编程·vibecoding
Tony沈哲19 小时前
AI Coding 让我两天完成图像编辑器 Monica 的国际化与多主题
ai编程·vibecoding
SamDeepThinking20 小时前
有了 AI IDE 之后,为什么还还要 CLI?
后端·ai编程·cursor
RainbowSea21 小时前
8. Spring AI tools/function-call
java·spring·ai编程
RainbowSea21 小时前
7. Spring AI 对话记忆 + 结构化输出
java·spring·ai编程
ChinaRainbowSea1 天前
6. Advisor 对话拦截
java·人工智能·后端·spring·ai编程
程序员鱼皮1 天前
我用 AI 做了个小程序,治好了我的学习焦虑症!
程序员·ai编程·trae
ChinaRainbowSea1 天前
5. Prompt 提示词
java·人工智能·后端·spring·prompt·ai编程