Claude降智再被实锤!推理能力严重下滑,用户连夜跑路 Codex

Claude 塌房了,从来不降智的它居然降智了!

这次翻车翻得有点大。

事情的起因,是 AMD 的一位工程主管 Stella Laurenzo。

这位老姐直接在 GitHub 上开了个 Issue,标题简单粗暴 ------ 「Claude Code 已经没法用来做复杂工程了」。

​编辑

他和团队分析了自己的 6852 个 Claude Code 会话、17871 个思考块、234760 次工具调用。

结果发现Claude的思考深度暴跌 73%。

读写比也从 6.6 掉到 2.0。

简单来说就是以前 Claude 每改一行代码,会平均读 6.6 次相关文件(看上下文、看测试、看关联逻辑),现在只读 2 次。

随即越来越多的人发现,Claude Opus4.6也不再是从前的哪个Opus 4.6了。

​编辑

眼瞅着事情越闹越大,Claude Code 的负责人 Boris Cherny 最后亲自在 GitHub 和论坛下场回了一贴。

大致的意思是说:关于 redact-thinking 功能,该测试版头部配置仅在界面中隐藏思考过程,因为绝大多数用户并不会查看这部分内容。

它不会影响模型实际的思考行为,也不会改变思考配额或底层扩展推理机制,属于纯界面层面的改动。 其次他也承认了两项实质调整。

  • 2 月 9 日:随 Opus 4.6 引入"自适应思考"(adaptive thinking)机制。
  • 3 月 3 日 :默认 effort 等级从 High 调到了 Medium(85)

唯独没有提Claude减智。

然而,这一解释并未平息社区质疑, 多位开发者表示,即便将effort调至最高,Claude依旧摆烂。

嗯......怎么说呢,官方回应看看就好。

而在今天,Claude降智似乎被实锤了,claude opus4.6 推理水平被削弱了,幻觉基准测试从 83.3% 降到了 68.3%。

​编辑

反正程序员已经用脚投票好了,打开 X 搜一下 "switched from Claude to Codex",那叫一个壮观,每天都有几十条告别信体的帖子:

​编辑

然后,就在所有人都开始迁移到 Codex 的时候,OpenAI 出招了。

4 月 9 日,OpenAI 正式上线了一个全新的订阅档位:ChatGPT Pro $100/月

新档位主打一件事:5 倍于 Plus 的 Codex 使用额度。

而且作为发布促销,5 月 31 日之前订阅,直接给你 10 倍 Plus 的额度。

配套还送 GPT-5.4 Pro 模型、GPT-5.3-Codex-Spark 研究预览版,基本上是把 <math xmlns="http://www.w3.org/1998/Math/MathML"> 200 P r o 档位的能力下放到了 200 Pro 档位的能力下放到了 </math>200Pro档位的能力下放到了100。

当然,这期间也有人吐槽 Plus 的 Codex 额度下降了。

Plus 之前的 Codex 额度:

​编辑

Plus 最新的 Codex 额度:

​编辑

虽然 Plus 额度被砍,但很多人依旧选择 Codex,原因也很简单 ,Claude 降智太严重,已经到了不可使用的地步

相反,chatgpt似乎没有降智了,特别是大家发现它的Debug能力似乎比CC还厉害。

再加上同时20美刀的基础套餐,CodexI的使用额度确实比Claude code多得多。

所以大家依旧选择Codex。

对于不知道如何升级 Pro 或者 Plus 的伙伴,我之前写了一篇文章大家可以参考。

**相关阅读: **ChatGPT Plus 第三方订阅方法汇总测评: Wild AI vs银河录像局 vs 环球巴士

可能大家会好奇如何查看自己的Codex额度。

在本地的 Codex CLI 上, 你可以直接执行:/status 指令就可以查看。

​编辑

也可以在Codex的网页端查看!

​编辑

最后,不得不吐槽Anthropic这波非常操作非常魔幻。

Anthropic 花了整整一年时间,把 Claude Code 捧成了"最强编程 AI"的代名词。

开发者们掏 200 美金/月都觉得物超所值。

Anthropic 靠着 Claude Code 单年干出 25 亿美金的收入,把 OpenAI 一度逼的没有办法。

然后他们用模型降智,把自己辛辛苦苦攒下来的这批铁粉,一个一个、亲手、免费,送到了 Codex 门口。

完全可以想象 OpenAI 的产品经理那天在工位上笑出了声。

编辑

这大概是 AI 编程史上最贵的一次自摆乌龙。

虽然很多人说这是为了mythos模型节约算力,但你既不给我用,还把天选打工人Opus 4.6降智了!

那我只能换一个打工人了!

相关推荐
Rabbit_QL2 小时前
【理论分析】信息熵的极值问题:什么时候最小?什么时候最大?
人工智能·深度学习
❀͜͡傀儡师2 小时前
Spring AI Alibaba vs. AgentScope:两个阿里AI框架,如何选择?
java·人工智能·spring
njsgcs2 小时前
MPNN框架 消息生成与聚合 (公式 1)
人工智能
格林威2 小时前
AI视觉检测:INT8 量化对工业视觉检测精度的影响
linux·运维·人工智能·数码相机·计算机视觉·视觉检测·工业相机
新缸中之脑2 小时前
ROS 2 Composition简明教程
人工智能
艾为电子3 小时前
【应用方案】会议&面试记录终结者-艾为AI智能录音卡方案,清晰拾音,解放双手
人工智能·ai
AI攻城狮3 小时前
Adaptive Thinking 的代价:当 AI 自己决定"想多少"
人工智能·云原生·aigc
Z.风止3 小时前
Large Model-learning(3)
人工智能·笔记·后端·深度学习
LX567773 小时前
传统销售如何系统学习成为AI智能销售顾问?认证指南
人工智能·学习