Gemini 2.5 荣登 AI 排行榜榜首

Gemini 2.5 登顶AI排行榜

2025年03月26日 | AI日报

Google凭借其强大的新Gemini 2.5 Pro模型重回AI排行榜榜首------该模型在推理、数学、科学和编码等基准测试中占据主导地位。

但随着AI以闪电般的速度持续发展，以及OpenAI等竞争对手正在准备下一代模型，Google能保持王座多久？

阅读时间: 5分钟

概要 : Google刚刚宣布了Gemini 2.5，这是一个内置推理功能的新AI模型系列------首发的Gemini 2.5 Pro Experimental在关键基准测试中名列前茅，代表了该公司迄今为止最智能的模型。

详情:

2.5 Pro在LMArena排行榜上首次亮相即排名第一，展示了在数学、科学和编码任务方面先进的SOTA推理能力。
在编码方面，2.5 Pro在SWE-Bench Verified上得分为63.8%，在Aider Polyglot上得分为68.6%------在Web应用和代理代码应用方面表现尤为突出。
该模型初始提供100万token的上下文窗口，但Google很快计划将其翻倍至200万，以处理整个代码库和海量数据集。
该模型现已在Google AI Studio和Gemini应用中向高级订阅用户开放，API定价将在未来几周内公布。

重要性: 随着各大AI实验室在推理方面不断推进，Google已将"思考"作为标准而非高端功能。尽管缺乏OpenAI那样的炒作，这家科技巨头仍在持续推出SOTA模型------但随着AI发展速度之快(以及GPT-5等模型即将到来)，新排名能保持多久还有待观察。

概要 : OpenAI发布了其GPT-4o模型和Sora视频生成器中的图像生成功能，从独立的文本和图像系统转变为完全集成的方法，通过ChatGPT生成更精确和具有上下文感知能力的视觉效果。

详情:

重要性: OpenAI的DALL-E远远落后于其他图像生成器，但这一期待已久的内置图像升级看起来值得等待。凭借长文本生成、UI/UX设计技能和自然语言编辑能力，视觉内容生成正随着这一新一代模型进入一个全新的时代。

概要 : 据报道，Apple正在下达一份价值10亿美元的Nvidia先进服务器订单，与Dell和Super Micro Computer合作建立其首个生成式AI基础设施------这标志着该公司在Siri受挫后AI战略的重大转变。

详情:

Loop Capital分析师Anada Baruah报告称，该采购包括约250台Nvidia的GB300 NVL72系统，每台服务器成本在370-400万美元之间。
据报道，Dell Technologies和Super Micro Computer都将成为构建Apple新大规模AI集群的关键服务器合作伙伴。
虽然之前的报道指出Apple正在开发自己的AI芯片，但此次采购可能是对该领域进展慢于预期的回应。
此举也是在Apple AI开发受挫之后，包括计划中的AI驱动Siri升级延迟和内部重组。

重要性: 在竞争对手竞相前进时，Apple一直置身于AI数据中心竞赛之外，现在似乎承认需要强大的计算能力来竞争------并且必须寻求外部资源来解决目前困扰其内部AI进展的问题。但时间紧迫，AI的进步不会放缓。