Claude 塌房了,从来不降智的它居然降智了!
这次翻车翻得有点大。
事情的起因,是 AMD 的一位工程主管 Stella Laurenzo。
这位老姐直接在 GitHub 上开了个 Issue,标题简单粗暴 ------ 「Claude Code 已经没法用来做复杂工程了」。
编辑
他和团队分析了自己的 6852 个 Claude Code 会话、17871 个思考块、234760 次工具调用。
结果发现Claude的思考深度暴跌 73%。
读写比也从 6.6 掉到 2.0。
简单来说就是以前 Claude 每改一行代码,会平均读 6.6 次相关文件(看上下文、看测试、看关联逻辑),现在只读 2 次。
随即越来越多的人发现,Claude Opus4.6也不再是从前的哪个Opus 4.6了。
编辑
眼瞅着事情越闹越大,Claude Code 的负责人 Boris Cherny 最后亲自在 GitHub 和论坛下场回了一贴。
大致的意思是说:关于 redact-thinking 功能,该测试版头部配置仅在界面中隐藏思考过程,因为绝大多数用户并不会查看这部分内容。
它不会影响模型实际的思考行为,也不会改变思考配额或底层扩展推理机制,属于纯界面层面的改动。 其次他也承认了两项实质调整。
- 2 月 9 日:随 Opus 4.6 引入"自适应思考"(adaptive thinking)机制。
- 3 月 3 日 :默认 effort 等级从 High 调到了 Medium(85)
唯独没有提Claude减智。
然而,这一解释并未平息社区质疑, 多位开发者表示,即便将effort调至最高,Claude依旧摆烂。
嗯......怎么说呢,官方回应看看就好。
而在今天,Claude降智似乎被实锤了,claude opus4.6 推理水平被削弱了,幻觉基准测试从 83.3% 降到了 68.3%。
编辑
反正程序员已经用脚投票好了,打开 X 搜一下 "switched from Claude to Codex",那叫一个壮观,每天都有几十条告别信体的帖子:
编辑
然后,就在所有人都开始迁移到 Codex 的时候,OpenAI 出招了。
4 月 9 日,OpenAI 正式上线了一个全新的订阅档位:ChatGPT Pro $100/月。
新档位主打一件事:5 倍于 Plus 的 Codex 使用额度。
而且作为发布促销,5 月 31 日之前订阅,直接给你 10 倍 Plus 的额度。
配套还送 GPT-5.4 Pro 模型、GPT-5.3-Codex-Spark 研究预览版,基本上是把 <math xmlns="http://www.w3.org/1998/Math/MathML"> 200 P r o 档位的能力下放到了 200 Pro 档位的能力下放到了 </math>200Pro档位的能力下放到了100。
当然,这期间也有人吐槽 Plus 的 Codex 额度下降了。
Plus 之前的 Codex 额度:
编辑
Plus 最新的 Codex 额度:
编辑
虽然 Plus 额度被砍,但很多人依旧选择 Codex,原因也很简单 ,Claude 降智太严重,已经到了不可使用的地步。
相反,chatgpt似乎没有降智了,特别是大家发现它的Debug能力似乎比CC还厉害。
再加上同时20美刀的基础套餐,CodexI的使用额度确实比Claude code多得多。
所以大家依旧选择Codex。
对于不知道如何升级 Pro 或者 Plus 的伙伴,我之前写了一篇文章大家可以参考。
**相关阅读: **ChatGPT Plus 第三方订阅方法汇总测评: Wild AI vs银河录像局 vs 环球巴士
可能大家会好奇如何查看自己的Codex额度。
在本地的 Codex CLI 上, 你可以直接执行:/status 指令就可以查看。
编辑
也可以在Codex的网页端查看!
编辑
最后,不得不吐槽Anthropic这波非常操作非常魔幻。
Anthropic 花了整整一年时间,把 Claude Code 捧成了"最强编程 AI"的代名词。
开发者们掏 200 美金/月都觉得物超所值。
Anthropic 靠着 Claude Code 单年干出 25 亿美金的收入,把 OpenAI 一度逼的没有办法。
然后他们用模型降智,把自己辛辛苦苦攒下来的这批铁粉,一个一个、亲手、免费,送到了 Codex 门口。
完全可以想象 OpenAI 的产品经理那天在工位上笑出了声。
编辑
这大概是 AI 编程史上最贵的一次自摆乌龙。
虽然很多人说这是为了mythos模型节约算力,但你既不给我用,还把天选打工人Opus 4.6降智了!
那我只能换一个打工人了!