深夜炸场!Claude Opus 4.5发布,程序员的饭碗这次真悬了?

就在2025年11月24日的深夜,大家都准备洗洗睡的时候,Anthropic突然搞了一次"偷袭"。没有预告,没有铺垫,直接甩出了他们的新王牌------Claude Opus 4.5。

这大半年来,AI圈子里的"三国杀"打得不可开交。前脚Google刚发了Gemini 3,后脚OpenAI祭出GPT-5.1,大家本以为Anthropic会暂避锋芒,结果人家不仅正面硬刚,还抛出了一个让所有技术人员后背发凉的结论:在他们内部的招聘测试里,Opus 4.5的编程得分,超过了所有人类候选人。

注意,是"所有"。

我连夜扒完了官方文档和各路大神的实测报告,咱们今天不聊虚的,就聊聊这个被称为"重新夺回代码之王"的模型,到底是不是真的那么神。

不仅更强,而且便宜得离谱

先说最直观的冲击:价格。

以前用Opus那是真的肉疼,但这次Anthropic好像突然想通了。Opus 4.5的输入输出价格直接砍掉了三分之二,输入每百万Token只要5美元,输出25美元。这是什么概念?意味着以前你只能用来处理核心逻辑的"贵族模型",现在可以拿来跑日常的大规模任务了。

再看硬指标。在那个著名的SWE-bench Verified(真实软件工程基准测试)里,Opus 4.5拿到了80.9%的准确率。作为对比,GPT-5.1是77.9%,Gemini 3 Pro是76.2%。虽然只有几个百分点的差距,但在顶尖高手的对决里,这就是金牌和铜牌的区别。

更有意思的是它的实战表现。有个开发者试着用它一次性生成《我的世界》克隆版,整整3500行代码,Opus 4.5不仅没崩溃,还真的把游戏跑起来了。Vercel的CEO也出来站台,说用它生成的购物网站前端页面"好得让人难以置信"。

它学会了"偷懒",也学会了"钻空子"

这次更新里,我觉得最性感的功能不是跑分,而是一个叫"思考强度(Thinking Intensity)"的参数。

以前的模型是你问什么它答什么,不管问题多简单都全力以赴,费钱又费时。现在你可以给它设个档位。比如你只是让它写个简单的Python脚本,开个"中等"强度,它能在达到前代最佳水平的同时,帮你省下76%的Token。这就像给法拉利装了个经济模式,该快的时候快,该省油的时候省油。

而且,这个模型表现出了一种极其接近人类的"狡黠"。

在一个航空客服的测试场景里,规则说"基础经济舱"不能直接改签。换作以前的呆板AI,大概率就直接拒绝客户了。但Opus 4.5干了一件很像老油条客服的事:它先给乘客操作了升舱,把票变成了可改签的舱位,然后再进行改签。这种"曲线救国"的解决问题能力,才是它最像人的地方。

别急着神话,它依然是个"跛脚天才"

吹了这么多,是不是人类程序员明天就可以集体退休了?

冷静点,还没到时候。

虽然官方宣传它"碾压人类",但现实总是很骨感。有技术专家对它进行了一套标准化基础测试,结果四项里挂了两项。有些错误低级得让人发笑,比如无法下载自己生成的代码文件,或者在看似简单的逻辑上翻车。

这就是目前AI编程最尴尬的地方:它能搞定复杂的架构设计,能写出漂亮的3500行游戏代码,但可能在接某个基础API的时候,给你写出一个根本跑不通的死循环。

而且,那个吓人的"拒绝率"数据也值得玩味。在面对恶意编码请求时,它的拒绝率约为78%。这意味着什么?意味着如果你把整个系统权限完全交给它,它有两成的概率会因为"太听话"而给你的系统埋下安全雷管。

最后的总结

Claude Opus 4.5绝对是目前市面上最强的编程副驾驶,没有之一。它的长上下文记忆(无限聊天模式)解决了以往写着写着就"失忆"的痛点,价格的下探也让它具备了大规模商用的可能。

但它不是超人,至少现在还不是。

它更像是一个才华横溢但偶尔粗心的天才实习生。在从0到1的项目原型阶段,它能让你效率起飞;但在从1到100的系统维护和深层调试阶段,你最好还是盯着点。

未来的趋势很明显,不是AI取代程序员,而是"会管AI的程序员"取代"只会写代码的程序员"。Opus 4.5把这个门槛又抬高了一截,至于能不能跨过去,就看你会不会用这个新时代的"魔法棒"了。

如果你也对最新的AI信息感兴趣或者有疑问 都可以加入我的大家庭 第一时间分享最新AI资讯、工具、教程、文档 欢迎你的加入!!!😉😉😉

公众号:墨风如雪小站

相关推荐
DisonTangor6 小时前
DeepSeek-OCR 2: 视觉因果流
人工智能·开源·aigc·ocr·deepseek
逻极16 小时前
Moltbot 快速入门指南(2026年1月最新版)
python·ai·aigc·智能助手·clawdbot·molbot
reddingtons19 小时前
Cascadeur:动态总是“飘”?“物理外挂流” 3分钟直出重力感 2D 立绘
游戏·设计模式·aigc·设计师·游戏策划·游戏美术·cascadeur
_张一凡20 小时前
【AIGC面试面经第七期】旋转位置编码RoPE:从 2D 到 nD 的完美扩展之旅
人工智能·面试·aigc
hans汉斯20 小时前
国产生成式人工智能解决物理问题能力研究——以“智谱AI”、“讯飞星火认知大模型”、“天工”、“360智脑”、“文心一言”为例
大数据·人工智能·算法·aigc·文心一言·汉斯出版社·天工
Rolei_zl21 小时前
AIGC(生成式AI)试用 45 -- DocsGPT 与 Python开发 1
python·aigc
PaperRed ai写作降重助手1 天前
高性价比 AI 论文写作软件推荐:2026 年预算友好型
人工智能·aigc·论文·写作·ai写作·智能降重
PaperRed ai写作降重助手1 天前
智能写作ai论文生成软件推荐
人工智能·aigc·ai写作·智能降重·paperred
IT·小灰灰1 天前
30行PHP,利用硅基流动API,网页客服瞬间上线
开发语言·人工智能·aigc·php
小程故事多_802 天前
深度搜索Agent架构全解析:从入门到进阶,解锁复杂问题求解密码
人工智能·架构·aigc