Claude降智再被实锤!推理能力严重下滑,用户连夜跑路 Codex

Claude 塌房了，从来不降智的它居然降智了！

这次翻车翻得有点大。

事情的起因，是 AMD 的一位工程主管 Stella Laurenzo。

这位老姐直接在 GitHub 上开了个 Issue,标题简单粗暴 ------ 「Claude Code 已经没法用来做复杂工程了」。

编辑

他和团队分析了自己的 6852 个 Claude Code 会话、17871 个思考块、234760 次工具调用。

结果发现Claude的思考深度暴跌 73%。

读写比也从 6.6 掉到 2.0。

简单来说就是以前 Claude 每改一行代码，会平均读 6.6 次相关文件（看上下文、看测试、看关联逻辑），现在只读 2 次。

随即越来越多的人发现，Claude Opus4.6也不再是从前的哪个Opus 4.6了。

编辑

眼瞅着事情越闹越大，Claude Code 的负责人 Boris Cherny 最后亲自在 GitHub 和论坛下场回了一贴。

大致的意思是说：关于 redact-thinking 功能，该测试版头部配置仅在界面中隐藏思考过程，因为绝大多数用户并不会查看这部分内容。

它不会影响模型实际的思考行为，也不会改变思考配额或底层扩展推理机制，属于纯界面层面的改动。其次他也承认了两项实质调整。

2 月 9 日：随 Opus 4.6 引入"自适应思考"（adaptive thinking）机制。
3 月 3 日 ：默认 effort 等级从 High 调到了 Medium（85）

唯独没有提Claude减智。

然而，这一解释并未平息社区质疑， 多位开发者表示，即便将effort调至最高，Claude依旧摆烂。

嗯......怎么说呢，官方回应看看就好。

而在今天，Claude降智似乎被实锤了，claude opus4.6 推理水平被削弱了，幻觉基准测试从 83.3% 降到了 68.3%。

编辑

反正程序员已经用脚投票好了，打开 X 搜一下 "switched from Claude to Codex"，那叫一个壮观，每天都有几十条告别信体的帖子：

编辑

然后，就在所有人都开始迁移到 Codex 的时候，OpenAI 出招了。

4 月 9 日，OpenAI 正式上线了一个全新的订阅档位：ChatGPT Pro $100/月。

新档位主打一件事：5 倍于 Plus 的 Codex 使用额度。

而且作为发布促销，5 月 31 日之前订阅，直接给你 10 倍 Plus 的额度。

配套还送 GPT-5.4 Pro 模型、GPT-5.3-Codex-Spark 研究预览版，基本上是把 $200 P r o 档位的能力下放到了 200 Pro 档位的能力下放到了$ 200Pro档位的能力下放到了100。

当然,这期间也有人吐槽 Plus 的 Codex 额度下降了。

Plus 之前的 Codex 额度：

编辑

Plus 最新的 Codex 额度：

编辑

虽然 Plus 额度被砍,但很多人依旧选择 Codex,原因也很简单，Claude 降智太严重,已经到了不可使用的地步。

相反，chatgpt似乎没有降智了，特别是大家发现它的Debug能力似乎比CC还厉害。

再加上同时20美刀的基础套餐，CodexI的使用额度确实比Claude code多得多。

所以大家依旧选择Codex。

对于不知道如何升级 Pro 或者 Plus 的伙伴，我之前写了一篇文章大家可以参考。

可能大家会好奇如何查看自己的Codex额度。

在本地的 Codex CLI 上， 你可以直接执行：/status 指令就可以查看。

编辑

也可以在Codex的网页端查看！

编辑

最后，不得不吐槽Anthropic这波非常操作非常魔幻。

Anthropic 花了整整一年时间,把 Claude Code 捧成了"最强编程 AI"的代名词。

开发者们掏 200 美金/月都觉得物超所值。

Anthropic 靠着 Claude Code 单年干出 25 亿美金的收入,把 OpenAI 一度逼的没有办法。

然后他们用模型降智,把自己辛辛苦苦攒下来的这批铁粉,一个一个、亲手、免费,送到了 Codex 门口。

完全可以想象 OpenAI 的产品经理那天在工位上笑出了声。

编辑

这大概是 AI 编程史上最贵的一次自摆乌龙。

虽然很多人说这是为了mythos模型节约算力，但你既不给我用，还把天选打工人Opus 4.6降智了！

那我只能换一个打工人了！