奥特曼仓促亮剑 GPT-5.2!一张图爆火全网,全面碾压 Gemini 3

「【新智元导读】Gemini 3 的惊艳表现打乱了 OpenAI 的阵脚,公司进入「红色警戒」状态,不得不提前发布 GPT-5.2,以作应对。」

紧急反击!

自从谷歌放出 Gemini 3 之后,OpenAI 快被逼疯了,奥特曼甚至宣布公司进入了「红色警戒」状态。

现在,他们终于出招了------ChatGPT-5.2。

据 The Verge 爆料,熟悉 OpenAI 计划的消息人士透露,OpenAI 将在下周(12 月 9 号)发布 GPT-5.2,首次对 Gemini 3 做出正面回应。

据悉,GPT-5.2 已经准备就绪,原计划本月下旬发布。

但 Gemini 3 的惊艳表现打乱了 OpenAI 的阵脚,他们不得不提前发布,做出应对。

《The Information》早些时候报道称,在 OpenAI 内部评估中,他们的下一代推理模型表现领先于谷歌的 Gemini 3。

不知道此次发布的 GPT-5.2 是不是「下一代」。

网上流传的一张 GPT-5.2 测试分数图片倒还是相当夸张的。

图片显示,GPT-5.2 的基准测试分数几乎全面超越 Gemini 3 Pro。

断崖式领先。

不过,网友们大都质疑这张图片的真实性。

毕竟我们现在生活在后 Nano Banana Pro 时代。

x 网友 Wes Roth 就将图片上传到 Gemini 分析,结果 Gemini 认定这张图就是谷歌 AI 生成的。

网友 Tanuki 指出,人类最后的考试 67.4% 的得分极不可信。

AIME 2025 100% 以及 MMMLU 100% 也是极其可疑。

网友 Parousia 也表示,这张图几乎可以肯定是虚构的------「看起来纯粹是愿望投射」。

「危机重重的 OpenAI」

谷歌发布的 Gemini 3 所展现出的强悍竞争力,让 OpenAI 措手不及。

自从 ChatGPT 问世以来,可以说它就是最先进模型的代表。

这是首次出现竞争对手在基准测试中全面领先的情况。

在知识、数学和编程领域的多项基准测试中,Gemini 已经略微领先于 OpenAI 的最先进模型。

这让很多人不再将 OpenAI 视为默认的性能标杆。

有数据显示,OpenAI 在一周内流失了大约 6% 的用户,这意味着数百万用户转向了其他平台。

这其中,最有可能的就是转向谷歌 Gemini。

ChatGPT 目前拥有 8 亿月活用户,但其移动端使用量和付费增长已陷入停滞。

而用户数接近 6.5 亿的 Gemini 凭借在谷歌搜索、安卓系统及办公工具中的集成优势持续扩张。

OpenAI 披露 2025 年营收约 130 亿美元,但分析师预测其到 2029 年可能累计亏损达 1400 亿美元。

而谷歌每季度能够创造约 300 亿美元利润,足以支撑其开发成本更低的功能。

奥特曼宣布进入「红色警戒」状态,实际上是一个紧急信号------让 ChatGPT 重回巅峰。

他们为此全力专注于此次应对行动。

由于这种紧迫性,GPT-5.2 可能只有数天的时间来完成并部署这次重大更新。

如此仓促的发布,也很有可能带来问题。

此外,谷歌还拥有分发优势,他们能在一夜之间通过搜索、Gmail 和 Workspace 将新功能推送给数十亿用户。

更宏观的图景在于,AI 领域刚刚从一家独大转变为多方竞逐的局面。

未来几年,将会出现这种持续的更新周期,各种模型在技术竞赛中不断互相超越。

若 GPT-5.2 能够成功夺回基准测试的桂冠,OpenAI 将赢得宝贵的时间窗口与市场稳定期。

倘若发布时存在缺陷或未达预期,谷歌将主导行业话语权。

有趣的是,这正是当初 ChatGPT 横空出世时谷歌所承受的压力。

谁能持续站在 AI 性能的最前沿,并让用户确信其产品真正更胜一筹,谁就将赢得未来十年。

这正是此刻至关重要的原因。

参考资料:

x.com/kimmonismus...

x.com/stratechery...

www.theverge.com/report/8388...

相关推荐
AC赳赳老秦5 分钟前
代码生成超越 GPT-4:DeepSeek-V4 编程任务实战与 2026 开发者效率提升指南
数据库·数据仓库·人工智能·科技·rabbitmq·memcache·deepseek
液态不合群7 分钟前
推荐算法中的位置消偏,如何解决?
人工智能·机器学习·推荐算法
饭饭大王66611 分钟前
当 AI 系统开始“自省”——在 `ops-transformer` 中嵌入元认知能力
人工智能·深度学习·transformer
ujainu11 分钟前
CANN仓库中的AIGC可移植性工程:昇腾AI软件栈如何实现“一次开发,多端部署”的跨生态兼容
人工智能·aigc
初恋叫萱萱13 分钟前
CANN 生态实战指南:从零构建一个高性能边缘 AI 应用的完整流程
人工智能
Lethehong16 分钟前
CANN ops-nn仓库深度解读:AIGC时代的神经网络算子优化实践
人工智能·神经网络·aigc
开开心心就好17 分钟前
AI人声伴奏分离工具,离线提取伴奏K歌用
java·linux·开发语言·网络·人工智能·电脑·blender
TechWJ17 分钟前
CANN ops-nn神经网络算子库技术剖析:NPU加速的基石
人工智能·深度学习·神经网络·cann·ops-nn
凌杰18 分钟前
AI 学习笔记:LLM 的部署与测试
人工智能
心易行者20 分钟前
在 Claude 4.6 发布的当下,一个不懂编程的人聊聊 Claude Code:当 AI 终于学会自己动手干活
人工智能