奥特曼怕了!GPT-5.5「大蒜」决战谷歌,红色警报紧急拉响

「【新智元导读】三年河东三年河西,曾经逼疯谷歌的奥特曼,如今也被谷歌逼得拉响了「红色警报」,AI 王座之下已是刀光剑影。更劲爆的是,最强「Garlic」在预训练取得重大突破,正面硬刚 Gemini 3.」

三年前,ChatGPT 横空出世。

第一次感受到透骨恐惧的谷歌,仓促拉响了「红色警报」。

但谁能想到,仅仅三年,这个「红色警报」竟在 OpenAI 自己家里炸响!

CEO 奥特曼紧急发布全员信,字里行间只有一句:

ChatGPT,危在旦夕。

奥特曼:We are at a critical time for ChatGPT

「代号 Garlic」

「OpenAI 神秘模型曝光」

这一次,轮到 OpenAI 了。

据奥特曼透露,下周,OpenAI 计划发布一款全新的推理模型。

内部评估显示,这个模型在性能上要比 Gemini 3 更强,但在改善 ChatGPT 的「体验」方面还有更多工作要做。

不仅如此,Inforamtion 最新爆料称,OpenAI 还在研发新一代模型,内部代号「Garlic」(大蒜)。

「Garlic」在预训练方面,实现了重大突破。

它修复了 GPT-4.5 早期结构中的问题,预计明年初作为 GPT-5.2/GPT-5.5 发布。

至少在内部公测中,「Garlic」在编码和推理任务上,比谷歌 Gemini 3、Claude 4.5 Opus 更胜一筹。

上一周,首席研究官 Mark Chen 向内部团队做了闭门分享,核心就一句话:「Garlic」准备好了!

昨天一次访谈上,Mark Chen 公开回应,Gemini 3 是一款强大模型,但 OpenAI 已有与之实力相抗的模型。

由此来看,OpenAI 早已悄悄把下一张王牌攥在了手里。

Mark Chen 在内部的原话是:

我们打算尽快发布 Garlic 的某个版本。以目前的进度,明年初就能看到 GPT-5.2 或 GPT-5.5 发布,大家也不必感到惊讶。

此前,不仅 Information,还有 SemiAnalysis 多家外媒爆出,自 GPT-4o 之后,OpenAI 尚未完成下一代前沿大模型的预训练上。

因为这些挑战,OpenAI 才不得已将重心转向了------推理模型。

10 月,奥特曼曾向全员保证,OpenAI 将发布代号为「Shallotpeat」的新大语言模型,来应战谷歌 Gemini 3。

显然,「Garlic」和「Shallotpeat」是两款不同的模型。

前者整合了在开发「Shallotpeat」期间修复的 Bug,最关键的突破发生在「预训练阶段」。

众所周知,谷歌在 Gemini 3 上最大的底气,就是在预训练阶段实现了「质的飞跃」。

就连 OpenAI 高层,也在私下承认了这一点。

不过,在「Garlic」开发过程中,OpenAI 解决了此前预训练环节遇到的一些关键问题------

改进之前「最好的」且「体量大得多」的预训练模型。

也就是,今年 2 月发布后,便如昙花一现、如今已没什么存在感的 GPT-4.5。

本质上,这些优化可以让 OpenAI 将同样海量的知识注入到一个更小的模型中。而以前,只能通过开发巨量模型,来实现。

不用说,开发大模型肯定比开发小模型更烧钱、更耗时!

Mark Chen 还透露一个更炸裂的消息:

凭借着「Garlic」的经验积累,OpenAI 已悄然启动下一代更大、更强的模型了。

这两周,AI 圈的风向都吹向了谷歌,OpenAI 罕见地陷入了被动「追赶着」的角色。

Gemini 3 发布两周后,ChatGPT 日活跃用户下降了 6%

在扳回一局之前,OpenAI 必须拉响「红色警报」!

「「Code Red」」

「生死存亡保卫战打响」

几周前,为了改进 ChatGPT,OpenAI 曾宣布进入了「橙色警报」状态。

如今的如今,一切更加紧迫了。

随着 Code Red 的发布,「那些曾经排期在前的项目都被推迟了。」

  • 「广告业务」:本来想开始通过搜索赚钱的,先放放。
  • 「AI」 「智能体」:那种能帮你自动买票、挂号的全能助手,先等等。
  • 「Pulse」:本来打算每天早上给你发个性化新闻早报的产品,也砍掉了。

「目的很简单。」

「就是用手头上所有的算力、人力和财力,去****服务一件事:」

让现在的 ChatGPT 变得更好。

「「护城河」正在变浅」

为什么要如此大动干戈?

因为 OpenAI 发现,原本看起来不可逾越的领先优势,正在被对手一点点蚕食。

「1. 增长似乎没以前那么猛了:」

CFO 在与投资人的电话会议中暗示:ChatGPT 的某些增长指标在放缓------可能是用户数、使用时长、订阅数,等等。

「2. 谷歌的反击,越来越有威胁」****:

强大的新一代模型吸引力十足,不管是用户还是开发者,都不再只盯着 OpenAI 一家。

在搜索中加入的「AI 模式」,让搜索这件事变成了像是和「AI 聊天」一样。

种种因素叠加之后,Gemini 的月活用户也从 7 月的 4.5 亿,飙升到了 10 月的 6.5 亿。

奥特曼发内部信,警告道:谷歌在 AI 领域的卷土重来,可能会给 OpenAI 带来「暂时性的经济逆风」

「3. 要烧的钱,实在太多了:」

未来几年,为了训练更强模型 + 支撑 ChatGPT 跑起来,OpenAI 要烧掉数百亿美元。

反过来,ChatGPT 订阅带来的收入预期是:今年约 100 亿美元,明年 200 亿,2027 年 350 亿。

因此,为了给这场「烧钱长跑」续命,OpenAI 希望能够再融差不多 1000 亿美元。

但成功与否,就得看 ChatGPT 的表现如何了。

总结来说,在这样的背景下,「任何增长放缓、用户流失,都会被放大成「生死问题」」

  1. 用户量追逐战
  • OpenAI 表示,ChatGPT 目前承担了全球 70% 的「AI 助手活动」和 10% 的「搜索活动」。
  • 谷歌则展示 Gemini 的快速增长,把它深度整合到自家搜索和产品矩阵里。
  1. 生态 vs. 爆款
  • OpenAI 目前的王牌是:一个极强、极出圈的 ChatGPT + 一套开发者 API。
  • 谷歌拿出的则是:搜索 + 邮箱 + 文档 + 安卓 + 浏览器 + YouTube+...+Gemini,整个生态通通 AI 化。

「OpenAI 打算把资源砸在哪里?」

在备忘录里,奥特曼重点点了几条「优先级拉满」的方向:

「让每个人都能定制自己的 AI」

他说要**「让每周 8 亿次使用背后的人,感觉这就是****「 「我的 ChatGPT」」」**,而不是千篇一律的大众工具:

  • 允许用户定制:它的说话风格、偏好、工作流方式,甚至记住你是谁、你怎么做事。
  • 这和此前提到的「Memory」(记忆功能)一脉相承------AI 不只是回答问题,而是长期「认识你」。

现在的 ChatGPT,像一个每次见面都要重新自我介绍的前台。

而未来它更像一个长期跟你搭档的助理:记得你做什么工种、你家有几个孩子、你写代码用什么风格、你讨厌什么语气。

这件事,对**「提高用户黏性」**非常关键------

当一个工具开始「懂你」,你就不太想频繁换平台了。

「图像生成是第二战场」

图像生成之所以重要,是因为:

  • 很多人可能不会长期用 ChatGPT 写长文,但会**「经常来生图」**;
  • 这是和**「创作者、设计师、普通用户」联结的「关键」**入口;
  • 图像生成模型,也可以反哺很多**「产品场景」**(广告设计、电商展示、游戏概念图等)。

最近这段时间,谷歌便是凭借着 Nano Banana 和 Nano Banana Pro 断崖式的领先优势,连续数月称霸全球 AI 圈的热门话题。

所以也不难理解,为何奥特曼会把图像生成能力列为 Code Red 的重点之一了。

「赢下各种公开排行榜的心智战」

「模型行为」包括几件事:

  • 回答是否**「准确、有用、少胡说八道」**;
  • 是否语气舒服,不阴阳怪气、****「有人味」
  • 是否**「刚刚好拿捏」**安全与开放之间的尺度。

而奥特曼想要的,是大幅改善这些「行为」,从而让用户在 LMArena 这类公开排名里,更愿意选 ChatGPT 背后的模型,而不是竞品。

因为,这类榜单对**「开发者和重度用户」**影响很大,会影响他们选哪个模型来构建自己的应用。

「速度、可靠性和拒绝机制」

此外,奥特曼还点名了三个优化方向:

  • 回答**「速度」**更快
  • 「可靠性更高」
  • 「过度拒绝」」****「更少」

速度方面,不仅用户十分敏感,对于开发者来说更是如此------延迟太高,整个产品的体验就会直接崩盘。

与此同时,「过度拒绝」也是一个非常典型的使用痛点:你明明问的是正常问题,结果 AI 被风控吓到,动不动就说「对不起,我无法回答这个问题」。

接下来他们要做的是:「在安全红线内,尽量减少误伤正常需求。」

「这意味着什么?」

对于普通用户来说,他们在一个平台上投入的「时间 + 习惯」,会形成更强的锁定。

「未来的 ChatGPT,会越来越像」****「「私人」 「AI」 「助理」「,而不是公共问答机」」**。**它会更了解你的偏好、更会「记事」、更像一个长久陪伴的工具。

「体验方面,也会更快、更稳定,以及「更」少无故被拒」****。

如果能让用户使用起来更顺手,那么就有机会增加他们对 AI 的依赖度。也就是,从「偶尔玩玩」变成「每天离不开」。

**「图像、创意、多模态,会越来越重要」****。**不只是「问答和写作」,而是贯穿「写文 + 画图 + 做设计 + 查资料」的全套流程。

对于行业来说,「短期内」****「「卷体验」「会比」「卷参数量」「更重要」

「模型参数一再升级,普通用户已经分不清「1 万亿参数」和「2 万亿参数」的区别了。但是谁打开更快、谁更稳定、谁更懂自己,用户一用就知道。」

「对于」 「OpenAI」 「来说,这是一次」****「「不一定」决定生死 **、但估值意义极大****」 「的争夺战」。**

1000 亿美元的融资目标、数百亿美元的算力投入,都需要一个强而稳定的现金牛做支撑。

而 ChatGPT 就是这头牛:不仅要有流量,还要有粘性和付费意愿。

开发者和创业者,****「则要开始考虑站队哪个「「生态大本营」」:」

  • 如果 ChatGPT 的体验和口碑继续领先,它会成为大家默认接入的「AI 水电站」;
  • 谷歌等如果在某些场景做得更顺滑,势必分走一部分新应用。

「一场没有终点的军备竞赛」

「总结起来就一句:AI 赛道, 「没有永恒的王座。」

仅仅三年前,ChatGPT 还是那个把谷歌吓出一身冷汗的「屠龙少年」,如今却在疲于应对来自搜索帝国的凛冽反杀。

不过,这恰恰是普通用户的「时代红利」------他们卷得越凶,我们用得越爽。

千帆过尽,极致的产品体验,才是亘古不变的硬道理。

参考资料:HJY

www.theinformation.com/articles/op...

相关推荐
西柚小萌新42 分钟前
【深入浅出PyTorch】--9.使用ONNX进行部署并推理
人工智能·pytorch·python
LDG_AGI44 分钟前
【推荐系统】深度学习训练框架(十):PyTorch Dataset—PyTorch数据基石
人工智能·pytorch·分布式·python·深度学习·机器学习
oak隔壁找我1 小时前
Python + Langchain + Streamlit + DashScope 实现一个网页版聊天机器人
人工智能
是Dream呀1 小时前
昇腾实战|算子模板库Catlass与CANN生态适配
开发语言·人工智能·python·华为
曦云沐1 小时前
第二篇:LangChain 1.0 模块化架构与依赖管理
人工智能·langchain·智能体
长桥夜波1 小时前
机器学习日报23
人工智能·机器学习
roman_日积跬步-终至千里1 小时前
【模式识别与机器学习(9)】数据预处理-第一部分:数据基础认知
人工智能·机器学习
FL16238631291 小时前
自动驾驶场景驾驶员注意力安全行为睡驾分心驾驶疲劳驾驶检测数据集VOC+YOLO格式5370张6类别
人工智能·yolo·自动驾驶
Java中文社群1 小时前
找到漏洞了!抓紧薅~N8N调用即梦全免费
人工智能