Opus 4.7 来了,我并不建议你升级

大家好啊,我是董章鱼。

Anthropic 正式发布了 Claude Opus 4.7,距离上一代 Opus 4.6 才过去了两个多月。

看完官方公告和社区的真实反馈后,说实话有点"五味杂陈",值得聊一聊。

先说这次模型升级的硬指标。

Opus 4.7 的上下文窗口扩展到了 100 万 token,最大输出 128k token。

视觉分辨率从约 1.15MP 提升到了 3.75MP,在 SWE-bench Pro 编程测试中得分从 53.4% 跃升至 64.3%。

单看数据确实是一次大升级,尤其在软件工程任务上,Opus 4.7 的表现已经是目前公开模型中最好的一档。

Anthropic 自己也承认这不是他们最强的模型,更强的 Claude Mythos Preview 还在内测。

但 Opus 4.7 的定位是"靠谱"------严格按字面执行指令,不会自作主张地糊弄你。 mp.weixin.qq.com/s/CHDYlsnub...

变相涨价

但问题来了。

Opus 4.7 换了新的 tokenizer,相同输入的 token 消耗会增加约 1 到 1.35 倍。

价格表虽然没变,但实际开销却涨了。

这在 Reddit 上引发了大量吐槽,开发者们认为这是一次"变相涨价"。

更让人不舒服的是 API 层面的变化。

Opus 4.7 彻底移除了 temperature、top_p、top_k 这三个采样参数。

如果你在请求中设置这些参数,API 会直接返回 400 错误。

对于依赖 temperature=0 来保证输出一致性的生产系统来说,这是一个破坏性变更。

Anthropic 给出的替代方案是"通过提示词来控制行为",但这对需要精确控制的场景来说是远远不够的。

更聪明但更不透明

Opus 4.7 取消了之前版本中可以手动设置的 thinking budget,改为自适应推理模式。

由模型自行决定推理深度。

而且推理过程默认是隐藏的,如果你想看到模型的思考过程,需要手动开启 summarized 模式。

这对 Agent 工作流的调试非常不友好。

当你的 Agent 出了问题,你既不知道模型花了多少算力在思考,也看不到它具体在想什么。

排查问题的难度直接翻倍。

Anthropic 还引入了 Task Budget 功能,允许你为整个 Agent 循环设定 token 预算。

想法是好的,但实际表现不稳定。

预算太小的时候模型可能会偷工减料、返回不完整的结果,甚至直接拒绝任务。

另外还有一些"静默变更"值得警惕。

Opus 4.7 的行为变得更加字面化,不太会自动推断缺失的上下文。

这也就是模型稳定的来源。

所以,很有可能你之前好用的提示词不再好用,需要重新调整。

在这种情况下,你的系统不会崩溃,但会悄悄地表现得和预期不一样,这种 Bug 往往是最难发现的。

对于 AI 开发者来说,Opus 4.7 的能力提升是实打实的。

100 万上下文、64.3% 的 SWE-bench Pro 得分、更强的视觉理解,这些在长文档处理和复杂编码任务中都能带来切实的收益。

但代价是你失去了对模型行为的控制,同时面临隐性的成本上涨。

这就是为什么很多开发者对这次发布的态度不是兴奋,而是复杂------

能力更强了,但用起来却更难掌控了。

如果你的项目重度依赖采样参数调控或者对成本敏感,建议先在测试环境充分验证后再决定是否升级。

总的来说,不建议你立刻升级。 mp.weixin.qq.com/s/CHDYlsnub...

相关推荐
无敌昊哥战神2 小时前
【保姆级题解】力扣17. 电话号码的字母组合 (回溯算法经典入门) | Python/C/C++多语言详解
c语言·c++·python·算法·leetcode
脱氧核糖核酸__2 小时前
LeetCode热题100——238.除了自身以外数组的乘积(题目+题解+答案)
数据结构·c++·算法·leetcode
再卷也是菜2 小时前
算法提高篇(1)线段树(上)
数据结构·算法
py有趣2 小时前
力扣热门100题之单词拆分
算法·leetcode
j_xxx404_3 小时前
C++算法:哈希表(简介|两数之和|判断是否互为字符重排)
数据结构·c++·算法·leetcode·蓝桥杯·力扣·散列表
Aaron15883 小时前
RFSOC+VU13P+RK3588的核心优势与应用场景分析
嵌入式硬件·算法·matlab·fpga开发·信息与通信·信号处理·基带工程
优家数科3 小时前
精准预测:基于多维用水量的滤芯寿命预警算法
算法
脱氧核糖核酸__4 小时前
LeetCode热题100——189.轮转数组(题解+答案+要点)
数据结构·c++·算法·leetcode
贾斯汀玛尔斯4 小时前
每天学一个算法-快速排序(Quick Sort)
数据结构·算法