最佳work模型sonnet5来了,直接就能用!

你们的 Anthropic 账号还好么?Claude 新模型 Sonnet 5 来了! 我大概测了一下,有点东西。

这几天大家都说 Opus 4.8 疯狂降智,原来是为了它!

我快速看了它们的官方博客,快速总结一下:Sonnet 主打一个"物美"价廉,是最适合日常工作的模型!

先说物美!

这一波更新对 Sonnet 4.6 的用户来说绝对是一个巨大的好消息!

Sonnet 5 在推理、工具使用、编码和知识工作方面比 Sonnet 4.6 有显著改进,各方面参数都比 Sonnet 4.6 有巨大的提升,已经非常接近 Opus 4.8 了。

也就是说,Sonnet 是个各种工作都能干的模型,包括编程这一类工作,智能体编程能力真的是提升巨大!

知识工作方面也是提升巨大,甚至超过了 Opus 4.8!

除了这些基准指标之外,还有标准的 100 万上下文!

它的思考模式也从原来的扩展改为了自适应:

Adaptive thinking replaces extended thinking. It's on by default in Claude Code and the API. Start at medium effort, and bump to high for long agentic runs or memory-heavy work. Most coding and tool use won't need more than that.

这些变化其实都是为更加复杂的长任务而准备的。根据他们的测试,Sonnet 5 和 Sonnet 4.6 最大的差别就是"能和不能的差别"。

很多任务 Sonnet 4.6 直接摆烂,但是 Sonnet 5 可以很好地完成!

再说价廉

物美很重要,价廉就更好了。

说 Claude 便宜,骗鬼呢?确实,相对国产模型,不可能便宜。但是相比同样的国外模型,确实很便宜了。

模型 输入 缓存输入 输出 备注
Claude Sonnet 5 $2 $0.20 $10 2026 年 8 月 31 日前优惠价
Claude Sonnet 5 $3 $0.30 $15 2026 年 9 月 1 日起
Claude Opus 4.8 $5 $0.50 $25 Anthropic 高端旗舰档
GPT-5.5 $5 $0.50 $30 短上下文价格
GPT-5.5 长上下文 $10 $1.00 $45 OpenAI 单独长上下文档
Gemini 3.1 Pro Preview ≤200k $2 $0.20 $12 标准档
Gemini 3.1 Pro Preview >200k $4 $0.40 $18 超过 200k 输入后涨价

从上面的表格可以看到,Opus 4.8 的价格是输入 5、输出5、输出 5、输出25,Sonnet 5 的价格是输入 3、输出3、输出 3、输出15,然后在特惠期间只要 2和2 和 2和10。

这一档是国外顶级模型中最便宜的存在了!

虽然相比国产模型还是贵,但是拥有接近 Opus 4.8 的能力,价格却能打六折,这么看性价比就很高了。

所有人都能用

Fable 5 疯狂作妖,一会儿上,一会儿封,一会儿要认证。实在是让人太难了。Sonnet 5 在这方面就好多了。

直接全平台推送,手机、电脑、网页端立马可以用上。无论你是 Pro 用户还是免费用户,也能立马用上!

当然前提是你有账号,你的账号还活着~~!

做个小测试

我手里有非常多的测试项目,但是鉴于时间和 token 量的考虑,我就做一个最新的题目"天文机械表"!

这个题目是有点难度的,是多方面能力的考验。

最近测了一批模型,国产模型全躺,没有一个可以完成所有功能。之前只有 Opus 4.8 几乎满分。

完整的题目如下:

markdown 复制代码
用单个 HTML 文件实现一只机械腕表风格的天文时钟,纯原生实现,不许使用任何库、框架或 CDN。要求:
​
1. 主表盘读取本地系统时间,秒针平滑扫秒,使用 requestAnimationFrame 驱动,且长时间运行不得累积漂移;切到其他标签页再切回来时,指针必须立即校准到正确时间。
​
2. 包含一个月相小表盘,根据当前日期计算并显示月相连续变化,公式需要自行实现,精度要求误差控制在 1 天内。
​
3. 包含一个可用的计时码表,通过子表盘指针显示,支持开始、暂停、继续、归零与计圈(lap),按钮在任意顺序点击都不能出现状态错误。
​
4. 日期窗显示当前日期,正确处理大小月与闰年。
​
5. 包含昼夜 / 日出日落指示,用户可在三到四个预设城市之间切换,并根据经纬度现场计算当地日出日落时刻。
​
6. 页面需要响应式,并尊重 prefers-reduced-motion:开启时秒针改为跳秒并关闭装饰动画;同时为各表盘补充 ARIA 标注。
​
7. 整体视觉要像一只真实的高级腕表,而不是普通练习作业。
​
只输出最终代码,不要解释。

测试说明:

markdown 复制代码
这是一个面向前沿模型的**长规格前端综合题**。与普通模拟时钟不同,它故意把数学推导、动画工程、状态机正确性、无障碍适配与高级审美堆叠在同一题中,观察模型是否会在实现过程中静默漏需求。
​
题目的核心目标不是"做一个能转的表盘",而是要求模型在**闭卷推导**与**高约束实现**之间保持稳定。月相算法、日出日落计算、后台切回后的时间校准,以及计时码表的开始 / 暂停 / 继续 / 归零 / 计圈边界行为,都是高频失分点。
​
工程要求:主表盘必须使用 **requestAnimationFrame** 驱动平滑扫秒,不能依赖会累积漂移的定时器;切换后台标签页后,返回前台时指针必须立即与系统时间重新对齐。
​
设计要求:页面必须保持单文件、纯原生、响应式,同时尊重 **prefers-reduced-motion**,为关键表盘与控件补齐 ARIA 标注,并在整体视觉上呈现出真实机械天文腕表的精致感,而不是普通练习作业。
​
​

我直接用 Claude 桌面版的 Chat 功能进行测试:

思考强度是中等(Medium):

它上面还有三个大哥:High、Extra、Max!

结果出来了:

好像又是全对!

时钟显示正常,地区切换联动正常,秒表启动、停止、重置、lap 全部正常,月相应该也是正常的。

当前基本上属于整个月亮被点亮的状态!十五的月亮十六圆,现在刚十七。

Claude 诚不欺我,Sonnet 5 在这个题目上的结果和 Opus 4.8 几乎一致!

而且我这次只开了中档,当时 Opus 4.8 跑的是高档。事实证明,这个任务对应 Claude 最新系列的模型只要中档就够了。但是除了它家的模型之外,几乎都无法把这个题目全部做对。

所有的测试结果我都放在了 Jarvis Uni 的 TOPAI 板块中,大家可以进行非常直观的对比。

更多测试稍后奉上!

Sonnet 5 的思维能力这么强,这种复杂编程都不在话下,那么作为日常工作绝对是游刃有余了。再配合它们家的 Cowork 功能,不就是办公神器么?

现在有各种各样的Work工具,腾讯workbuddy,字节的traework,豆包专业版等等。其实最关键的还是底层模型和Harness的调教。这方面Claude Cowork绝对是鼻祖级别的存在了!

总结:

现在 Sonnet 5 真的是媲美 Opus 4.8 的存在了,成为了 Claude 系列中最具性价比、最适合日常工作的模型,也完全可以拿来做编程工作。

Anthropic 对我还算友好,账号一直都在,所以我也一直免费给他们做"自来水",实话实说,他们家的产品确实是最硬核的存在!

真正的智能是:这道题,它没见过,但是能做对。 目前大部分模型只是应试教育,只有Claude家的模型有一点智能!

相关推荐
IT_陈寒1 小时前
React hooks 闭包陷阱把我的状态吃掉了,原来问题出在这里
前端·人工智能·后端
冬奇Lab14 小时前
Workflow 系列(03):状态管理——持久化、幂等性与版本绑定
人工智能·工作流引擎
冬奇Lab14 小时前
每日一个开源项目(第146篇):openpilot - 开源自动驾驶辅助系统,曾在 Consumer Reports 评测中超过特斯拉 Autopilot
人工智能·开源·自动驾驶
吴佳浩15 小时前
AI 工程师知识地图:模型格式、框架、部署工具一次讲明白
人工智能·aigc·ai编程
IT_陈寒15 小时前
Java的Date类又坑了我一次,改用时间戳真香
前端·人工智能·后端
码农胖大海16 小时前
AI额度不够用的解决方案
人工智能
后端小肥肠16 小时前
小红书虚拟商品怎么做?我先用 Skill 跑通了壁纸品类
人工智能·aigc·agent
feiyu_gao16 小时前
从零搭建个人 AI 工作台:一个管理者的 3 个月实验
人工智能·aigc·团队管理