Gemini 2.5 登顶AI排行榜
2025年03月26日 | AI日报
欢迎各位人工智能爱好者
Google凭借其强大的新Gemini 2.5 Pro模型重回AI排行榜榜首------该模型在推理、数学、科学和编码等基准测试中占据主导地位。
但随着AI以闪电般的速度持续发展,以及OpenAI等竞争对手正在准备下一代模型,Google能保持王座多久?
今日AI要闻:
- Google的Gemini 2.5 Pro登顶AI排行榜
- OpenAI为GPT-4o和Sora添加图像生成功能
- 将概念转化为生产就绪的演示文稿
- Apple对Nvidia AI硬件的十亿美元押注
阅读时间: 5分钟
最新动态
🏆 Google的Gemini 2.5 Pro登顶AI排行榜
概要 : Google刚刚宣布了Gemini 2.5,这是一个内置推理功能的新AI模型系列------首发的Gemini 2.5 Pro Experimental在关键基准测试中名列前茅,代表了该公司迄今为止最智能的模型。
详情:
- 2.5 Pro在LMArena排行榜上首次亮相即排名第一,展示了在数学、科学和编码任务方面先进的SOTA推理能力。
- 在编码方面,2.5 Pro在SWE-Bench Verified上得分为63.8%,在Aider Polyglot上得分为68.6%------在Web应用和代理代码应用方面表现尤为突出。
- 该模型初始提供100万token的上下文窗口,但Google很快计划将其翻倍至200万,以处理整个代码库和海量数据集。
- 该模型现已在Google AI Studio和Gemini应用中向高级订阅用户开放,API定价将在未来几周内公布。
重要性: 随着各大AI实验室在推理方面不断推进,Google已将"思考"作为标准而非高端功能。尽管缺乏OpenAI那样的炒作,这家科技巨头仍在持续推出SOTA模型------但随着AI发展速度之快(以及GPT-5等模型即将到来),新排名能保持多久还有待观察。
🎨 OpenAI为GPT-4o和Sora添加图像生成功能
概要 : OpenAI发布了其GPT-4o模型和Sora视频生成器中的图像生成功能,从独立的文本和图像系统转变为完全集成的方法,通过ChatGPT生成更精确和具有上下文感知能力的视觉效果。
详情:
- GPT-4o将图像作为其多模态理解的一部分,实现了更准确的文本渲染和上下文感知。
- 该升级在生成菜单、图表和信息图等可读文本方面表现出色,解决了之前模型的主要弱点。
- 用户还可以用自然语言编辑图像,模型能够在迭代之间保持一致性,并处理10-20个对象的Prompt。
- 这一新功能取代了DALL-E 3,成为ChatGPT对免费、Plus、Pro和Team用户的默认图像生成器,Enterprise和Edu版本即将推出。
重要性: OpenAI的DALL-E远远落后于其他图像生成器,但这一期待已久的内置图像升级看起来值得等待。凭借长文本生成、UI/UX设计技能和自然语言编辑能力,视觉内容生成正随着这一新一代模型进入一个全新的时代。
💰 Apple对Nvidia AI硬件的十亿美元押注
概要 : 据报道,Apple正在下达一份价值10亿美元的Nvidia先进服务器订单,与Dell和Super Micro Computer合作建立其首个生成式AI基础设施------这标志着该公司在Siri受挫后AI战略的重大转变。
详情:
- Loop Capital分析师Anada Baruah报告称,该采购包括约250台Nvidia的GB300 NVL72系统,每台服务器成本在370-400万美元之间。
- 据报道,Dell Technologies和Super Micro Computer都将成为构建Apple新大规模AI集群的关键服务器合作伙伴。
- 虽然之前的报道指出Apple正在开发自己的AI芯片,但此次采购可能是对该领域进展慢于预期的回应。
- 此举也是在Apple AI开发受挫之后,包括计划中的AI驱动Siri升级延迟和内部重组。
重要性: 在竞争对手竞相前进时,Apple一直置身于AI数据中心竞赛之外,现在似乎承认需要强大的计算能力来竞争------并且必须寻求外部资源来解决目前困扰其内部AI进展的问题。但时间紧迫,AI的进步不会放缓。
快速浏览
- 🎆 Reve Image 1.0 - 具有高级真实感和Prompt准确性的图像模型
- 🐳 DeepSeek V3-0324 - V3升级版,改进了编码和推理能力
- 🧠 Qwen2.5-VL-32B - 新视觉语言AI,性能增强
- 🕺 LHM - 从单张参考图像创建动画3D头像
- OpenAI 宣布其高级语音模式的新升级,包括新个性升级和更少中断,实现更自然的对话。
- Figure AI 发布了其Figure 02人形机器人实现自然人类步态的新研究和演示,在短短几小时内完成了数年模拟训练。
- H&M正与30位模特合作创建基于AI的数字孪生用于广告活动,模特保留所有权并获得基于使用量的补偿。
- ByteDance 发布了InfiniteYou,一个开源AI肖像生成器,可生成具有增强面部准确性和Prompt一致性的肖像。
- Synthesia 推出了100万美元的股权计划,针对参与AI化身训练的表现者,成为首个向贡献于AI训练的表演者提供股票的公司。
- Otter AI 推出了三个AI会议代理,包括语音激活的会议代理、用于实时指导的销售代理和用于自主产品演示的SDR代理。
- Perplexity 添加了新的答案模式,通过图像、视频和内置商业交易的卡片等实体增强了对特定垂直领域的搜索。