永别了,GPT-4!

【新智元导读】GPT-4 时代,落幕了!它将被 GPT-4o 完全取代。而下周,我们也极有可能迎来 GPT-4.1、o3 满血版以及 o4-mini 这些新模型。大模型进化史,再次迎来关键节点。

猝不及防地,GPT-4 就这样退出历史舞台了。

4 月 10 日,OpenAI 正式宣布,即将从 ChatGPT 中移除两年前推出的 GPT-4。

从 4 月 30 日起,GPT-4 将被当前的默认模型 GPT-4o 完全取代。

当然,怀念 GPT-4 的用户们也不必悲伤,它仍然可以通过 OpenAI API 继续使用。

不过,在 GPT-4 退役之前,人们的注意力很可能就会转向 ChatGPT 的新模型。

如今各种爆料已经传得漫天飞,据说,GPT-4.1(包括 GPT-4.1-mini、GPT-4.1-nano 和 GPT-4.1),去年 12 月宣布的 o3 「推理」模型,以及 o4-mini 全新推理模型都要来了。

遥想 2023 年 3 月 14 日,GPT-4 正式发布,席卷全球,在全球掀起滔天巨浪,然后在两年内,引爆了全球 AI 大模型的寒武纪大爆发。

它的出现,开启了一个全新的时代,见证了一场技术井喷的大爆发,铺垫了后续无数 OpenAI 大模型的繁荣。

如今,这座灯塔终于要退出了。

GPT-4,已成历史尘埃


Perplexity CEO Aravind Srinivas 最近表示,AI 的进步已经跨越了临界点------三个月的时间,仿佛就已经跳过了一章历史。

「我们应该期待,在今年剩余的时间里,变化会来得更快。」

的确,就在过去短短三个月里,我们迎来了 DeepSeek R1、原生图像生成、o3-mini 等重磅炸弹,如今 2025 年也不过刚过去了四个月。

在 AI 圈的众多消息中,连 GPT-4 的退出都显得不那么惊爆了。

昨天的更新日志中,OpenAI 表示,现在 GPT-4o 已经成为了 GPT-4 合格的继任者。

近期的升级,提升了它的指令跟随、问题解决和对话流畅性。评估中,GPT-4o 在写作、编码、STEM 等方面始终优于 GPT-4。

确实,现在很多人都已经不记得,自己上一次用 GPT-4 是什么时候了。

虽然它确实给很多人带来了美好的回忆,甚至让人一度以为 AGI 已经来了。

还记得 2023 年 3 月,GPT-4 推出时全网欢呼的盛况吗?

当时,它在 ChatGPT 和微软的 Copilot 网页版聊天机器人中上线,引起全网惊呼。

这个模型具备多模态能力,能同时理解图像和文本,正式开启了 AI「看图说话」的时代,这在 OpenAI 的模型中尚属首次,可谓石破天惊。

相比于 GPT-3.5,GPT-4 是一次更重大的认知跃迁。

它是首个在专业学术基准中达到哈佛、斯坦福毕业生水平的大模型。

它在数学、医学、法律之类的考试中击败大多数人类;在 SAT、LSAT、美国律师资格考试中交出惊人答卷,能达到 TOP 10%。

它的多模态架构,也为后续的模型演进提供了核心蓝本。

从此,大模型能力的阈值彻底提升至可用级,引爆了全球的 AI 应用生态,将生成式 AI 市场从百亿规模推升至万亿的量级。

它推动了 Code Interpreter 的诞生,为开发者提供了无限助力,间接推动了开源生态。

那时,几乎每天一个劲爆消息。那是 OpenAI 的高光时刻,它的一举一动都牵动着全世界的目光。

当时,全网都在猜测 GPT-4 的训练成本。后来奥特曼透露,GPT-4 的训练成本超过了 1 亿美元。

终于,在 23 年 11 月,速度更快、成本更低的 GPT-4 Turbo 上线,接替了它的地位。

GPT-4,经典高光时刻


还记得这些辉煌时刻吗?

2023 年 3 月 14 日,GPT-4 诞生,首个多模态大模型震惊全世界,在 GRE 等各类考试中取得满分,凭自己就能考上斯坦福。

2023 年 3 月 16 日,GPT-4 全面接入微软 Office 全家桶,颠覆 10 亿打工人,人类与电脑交互方式彻底改变。

2023 年 3 月 17 日,OpenAI 发布 35 页论文官宣:GPT 时代,80% 的美国人就业将受 AI 影响。

2023 年 3 月 22 日,微软 154 页研究刷屏,GPT-4 已经可以被视为一个通用人工智能的早期版本。

2023 年 5 月 4 日,GPT-4 正式联网,微软开放搭载 GPT-4 的全新 Bing 聊天机器人,全面开放插件系统,无需排队人人可用。

2023 年 7 月 7 日,Code Interpreter 官宣向 Plus 用户全面开放,实测案例惊人。

下一个模型是 GPT-4.1

就在前一天,The Verge 独家爆料称,OpenAI 正准备发布一系列全新模型------包括 GPT-4.1(含 GPT-4.1 mini 和 GPT-4.1 nano)、满血版 o3,以及神秘的 o4 系列(o4-mini、o4-mini-high)。

其中,作为多模态模型 GPT-4o 改进版的 GPT-4.1,最快将在下周面世。

目前,AI 工程师 Tibor Blaho 已经在 ChatGPT 网页代码中发现了对这些模型的引用。

不过,GPT-4.5 都来了,为什么下一个却是 GPT-4.1?这个越来越倒退的命名规则,实在令人摸不到头脑。

它在 OpenAI 大模型谱系上有点前不着村后不着店,不知该放在什么位置。

有人赞叹道:看到从 GPT-1 到 o 系列以及更高级别的演变,展示了不断增加的复杂性和能力。这就像观察人工智能的进化史!

关于 GPT-4.1,现在坊间已经有了蛛丝马迹。

比如有人发现,在 ChatGPT 的模型列表中,竟然已经出现了 GPT-4.1 这个选项。

这就意味着,此前泄露的小道消息是真的!这就让大家非常兴奋。

但也有人怀疑该网友是造假,把网址从 GPT-4o 改为了 GPT-4.1。

为了自证清白,这名网友大方分享出了自己和 GPT-4.1 的对话链接。

因此大家确认,这名网友并没有撒谎,或伪造截图,因为顺着这个对话链接检查,会发现 model-slug 确实是 GPT-4.1。

很快,有越来越多的人发现自己也能用 GPT-4.1 了。

此外,也有网友推测,奥特曼口中的「Quasars Alpha」,就是 GPT-4.1。

为保 o3 发布,测试时间大幅缩短

而 FT 的报道也再次证实,满血版 o3 下周很可能再次上线。

知情人士透露,由于 Meta、谷歌、xAI 这些对手逼得实在太紧,OpenAI 为了保持自己的技术优势并从中获利,不得不加快模型的发布速度。

为此,曾经需要数月时间进行的模型「评估」------测试模型的风险和性能,如今已被压缩到了只有短短的几天。

比如即将退役的 GPT-4,就有着长达 6 个月的评估期。其中一些危险能力,正是在测试进行了两个月后才被发现的。

但现在给到的时间和资源,已经不足以进行全面的测试来识别和规避风险了。

此前,OpenAI 曾承诺构建定制版的模型来评估潜在的滥用风险,例如是否可能助长生物病毒提高传播能力。

但这种方法成本很高,不仅要聘请外部专家,还要创建诸如病毒学这类的专业信息数据集,并将其「喂」给模型来进行微调,消耗大量的工程师和计算资源。

很明显,OpenAI 不想在这件事上花太多精力------他们只对能力较弱的旧模型做了微调,没有用到更强、更先进的模型上。

比如,在 1 月份发布的 o3-mini 安全与性能报告中,仅仅提到了 GPT-4o 只会在微调后才能执行某项生物学任务。至于 o1 和 o3-mini 如何,OpenAI 却只字未提。

另外,还有一个令人担忧的问题是,安全测试针对的并不是最终向公众发布的模型,而是更为早期的「检查点」(checkpoints)。在这之后,模型还会继续更新来提升性能和能力。

面对这些质疑,OpenAI 回应称,其评估流程已通过引入自动化测试等方式提高了效率,从而缩短了所需时间。

「虽然目前还没有一套公认的方案,但 OpenAI 采用的方法肯定是最优的,并且已在报告中公开透明地进行了说明。」

此外,OpenAI 还表示,测试所用的检查点与最终发布的版本「基本一致」。

参考资料:

x.com/whylifeis4/...

www.ft.com/content/825...

techcrunch.com/2025/04/11/...

相关推荐
我是你们的星光6 分钟前
TensorFlow 的基本概念和使用场景
人工智能·深度学习
King.62414 分钟前
行业深度:金融数据治理中的 SQL2API 应用创新
大数据·开发语言·数据库·人工智能·sql·金融
云卓SKYDROID23 分钟前
无人机3S与4S电池技术对比!
人工智能·科技·无人机·科普·云卓科技
2303_Alpha24 分钟前
深度学习入门:神经网络的学习
人工智能·python·深度学习·神经网络·学习·机器学习
Blossom.11829 分钟前
边缘计算与隐私计算的融合:构建数据经济的“隐形护盾“
人工智能·深度学习·神经网络·目标检测·计算机视觉·数据挖掘·边缘计算
Clocky734 分钟前
图像预处理-色彩空间补充,灰度化与二值化
人工智能·计算机视觉
_一条咸鱼_1 小时前
大厂AI 大模型面试:监督微调(SFT)与强化微调(RFT)原理
人工智能·深度学习·面试
云卓SKYDROID1 小时前
无人机自主导航与路径规划技术要点!
人工智能·科技·无人机·科普·云卓科技
Lx3521 小时前
🌱 《能源消耗悖论:当AI开发遇上碳中和》
人工智能
黑心萝卜三条杠1 小时前
FineLIP:突破 CLIP 文本长度限制,解锁长文本与图像的细粒度对齐
人工智能