OpenAI开发的一款实验性大型语言模型（LLM），在2025年国际数学奥林匹克竞赛（IMO）中达到了金牌水平

每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/

界最具声望的数学竞赛------国际数学奥林匹克中取得金牌水平的表现。"

据介绍，该模型的评估完全按照人类参赛者的标准进行，包括两场各4.5小时的测试、不允许使用工具或连接互联网，并且需要针对IMO官方试题书写详细证明过程。最终，该模型成功解答了6道题中的5道，获得了42分中的35分。每道题由三位前IMO金牌得主独立评分，最终成绩在一致认同下确定。

IMO竞赛题目被广泛认为是竞赛数学领域中最具挑战性的题目，往往需要参赛者进行长时间、极具创造性的推理。对此，Wei指出，这是AI在推理基准测试上逐步取得突破的延续："从GSM8K（人类大约0.1分钟解答）→ MATH基准（1分钟）→ AIME（10分钟）→ IMO（100分钟），我们已经走了很长一段路。"

他进一步指出，IMO题目的难度要求模型具备前所未有的持续创造性思维能力，该成果也反映出"通用强化学习与测试时计算扩展"方面的进展。

尽管取得了突破性的表现，该模型在短期内不会向公众开放。Wei表示："这款获得IMO金牌的LLM是一个实验性研究模型，近期内不会发布任何具备这种数学能力的系统，至少还需几个月时间。"

与此并行，OpenAI计划很快推出GPT-5，但IMO竞赛能力模型属于另一个研究方向。"GPT-5即将发布，我们对此感到非常兴奋。"Wei透露。

与此同时，Hyperbolic Labs联合创始人Yuchen Jin也在X上暗示，GPT-5的发布可能已经迫在眉睫。据他透露，GPT-5并非单一模型，而是由多个专用模型构成的系统，并配备有一个动态路由器，可以根据任务在擅长推理、非推理以及工具使用的模型间智能切换。

Jin指出，这种架构可能正是OpenAI首席执行官Sam Altman此前所说的"修正模型命名"的原因，因为用户将无需手动选择具体模型，系统会自动将提示指向最合适的模型。

此外，Jin还透露，GPT-6目前已经进入训练阶段，并希望该过程不会因为更多的安全测试而被延迟。

Wei也提及了此次突破的更深层意义："这进一步说明AI在近年发展速度之快。2021年，导师Jacob Steinhardt让我预测到2025年7月AI在数学上的进展，当时我预测的是MATH基准的正确率达到30%......而如今，我们已经实现了IMO金牌。"

在这一成果背后，Sheryl Hsu、Noam Brown等研究人员也被特别提及并给予了高度评价。

而在去年，谷歌DeepMind旗下的AlphaProof与AlphaGeometry 2也曾在国际数学奥林匹克中解出6题中的4题，获得相当于银牌选手的得分，显示出AI数学能力正在多个维度快速提升。