GPT-5 王者降临，免费博士级 AI 全面屠榜！百万程序员不眠之夜，7 亿人沸腾

全球用户瞩目中，GPT-5 终于震撼登场了！

OpenAI 用一个多小时的超长发布会，全方位展示了 GPT-5 的炸裂性能。

奥特曼领衔，出场人数众多，华人依旧耀眼

正值每周 7 亿人使用 ChatGPT 之际，GPT-5 重磅发布了。它是对 GPT-4 的一次重大升级，更是标志着 OpenAI 在实现 AGI 道路上的一个重要里程碑。

OpenAI 介绍说，这是我们迄今为止最优秀的 AI 系统，智能远超之前的所有模型，在编码、数学、写作、健康、视觉感知上都性能卓越。

这个统一的系统，包含一个能够解答大多数问题的**「智能高效模型、一个能够解决更复杂问题的更深层次的推理模型」（GPT-5 Thinking），以及一个「实时路由器。」**

而 GPT-5、GPT-5-mini、GPT-5-nano 等多版本的分层推出，意味着 OpenAI 正在主动构建一个以 GPT-5 为底层核心的通用智能操作系统。

从现在开始，GPT-5 将成为 ChatGPT 中的默认模型，GPT-4o、o3、o4-mini、GPT-4.1 和 GPT-4.5 都将被它取代。

与此同时，****「所有 Plus、Pro、Team 和 Free 用户，都可以使用 GPT-5 了。」

如果你花钱订阅，就可以无限制访问 GPT-5 和 GPT-5 Pro，而免费用户在达到使用限制后，会转换到 GPT-5 mini。

直播后，LMArena 不装了，摊牌了：GPT-5 再创历史纪录，OpenAI 重回 AI 王座！

在文本、Web 开发和视觉领域排名第一

在硬提示、编程、数学、创造力、长查询等方面排名第一

在代号「summit」的测试下，GPT-5 目前持有最高的竞技场分数

「首测 GPT-5 编程写作，太顶了」

在多个跨学科的学术评估中，GPT-5 都超越了其他主流模型。

首先，GPT-5 是最好的编码模型，在 SWEBench 上直接刷新了历史最高分，这表明它在现实工程场景中性能超强。

在 Aider Polyglot 上，它也表现强大，证明了自己的多种编程语言能力。

在 MMMU 上，它也刷新了纪录；甚至在 AIME 2025（美国高中数学竞赛）中，它不仅远超以往模型，还接近甚至超过许多人类选手的表现。

而 OpenAI 这次着重强调的，就是 GPT-5 在真实世界中的表现------克服幻觉！把准确性和可靠性，都放在了最高优先级。

因此，他们专门构建了一套评估机制，结果显示：GPT-5 是目前最可靠、最真实、最可信的模型，显著减少了错误与幻觉。

比如在健康咨询中，GPT-5 的表现就尤其出色。在 250 名医生参与设计的临床场景评估中，它成为最值得信赖的「健康顾问级」模型。

而且，这个口袋博士团队级的模型，将免费向专业用户推出，可以连接所有工具。

GPT-5 一上线，我们立即开启了一波全面的实测，不得不说，其在编程、写作领域强到离谱。

首先是，小哥想要学习法语的网站，GPT-5 能够完美复刻。

一波演示下来，GPT-5 带来了亲眼所见的震撼，足以称得上是全球最好的编码模型。

「核心华人团队」

毫无意外，这次又是华人团队撑起了大半边天。

紧随奥特曼的，就是 OpenAI 首席研究官（Chief Research Officer）Mark Chen。

在 GPT-5 演示中，下列场景再次验证了「AI 圈处处有华人」：

4 人同台，有 3 位是华人。

从左至右以此为：Mark Chen、Rennie Song、Elaine Ya Le、Max Schwarzer

除了后训练负责人 Max Schwarzer，其他三人 Mark Chen、Rennie Song、Elaine Ya Le 都是华人。

此外，王若宸演示了 GPT-5 的语音 / 语音学习功能。他是 OpenAI 多模态研究科学家，训练了 ChatGPT 的语音模型。

奥特曼还点赞了另一位 GPT-5 核心成员 Tianfu Fu 的工作。他是 GPT-5 的核心贡献者。

总的来说，这次 GPT-5 发布，还是有不少可圈可点的地方，虽然基准测试图也被挑出了一些错处。

GPT-5 的直播结束，许多人还沉浸在兴奋和激动之中。

今夜无眠。

参考资料：YZJX