谷歌 Gemini 2.5 全线爆发!勇战「濒死恐慌」,却被丝血宝可梦吓到当场宕机

【新智元导读】今天,谷歌旗舰 Gemini 2.5 三箭齐发,首次亮相轻量版 2.5 Flash-Lite。最新 70 页技术报告中,爆料了 Gemini 2.5 在玩宝可梦濒死时,惊现类人的恐慌,导致推理性能直线下降。

昨夜,Gemini 2.5 全家桶三款模型,正式上线。

Gemini 2.5 Pro (正式版,与 0605 预览版相比无明显变化)

Gemini 2.5 Flash(正式版,与 0520 预览版相比定价有变)

Gemini 2.5 Flash-Lite(预览版,最小推理模型)

这次,Gemini 2.5 Flash 和 Gemini 2.5 Pro 正式版上线,与谷歌 I/O 大会公布的预览版性能无明显变化。

2.5 Flash-Lite 预览版则是速度最快、性价比最高的 Gemini 2.5 系模型。

未开启思考模式,Flash-Lite 版输入价格仅为 0.1 美元 / 百万 token,输出价格 0.4 美元 / 百万 token。

基准测试显示,2.5 Flash-Lite 版(开启思考模式)在数学、知识问答、编码、视觉理解、多语种性能上,足以媲美 2.5 Flash。

相较于上一代,2.5 Flash-Lite 性能提升显著,尤其是在数学、编码任务中。

在 LMArena 榜单中,Gemini-2.5-Flash-Lite 在文本竞技场中位列第 12,创意写作中第 3,编程中第 14,在 Hard Prompt 中第 17。

左右滑动查看

谷歌 VP 一个 demo 告诉你,2.5 Flash-Lite 输出速度,能快到实时编写每个界面的代码。

视频详情

它还通过了物理模拟测试。

参考资料:

storage.googleapis.com/deepmind-me...

x.com/sundarpicha...

blog.google/products/ge...

developers.googleblog.com/en/gemini-2...

相关推荐
百胜软件@百胜软件28 分钟前
黄飞对话阿里云AI专家:当零售中台拥有AI大脑,未来将去向何方?
人工智能·阿里云·零售
数科云8 小时前
AI提示词(Prompt)入门:什么是Prompt?为什么要写好Prompt?
人工智能·aigc·ai写作·ai工具集·最新ai资讯
Devlive 开源社区8 小时前
技术日报|Claude Code超级能力库superpowers登顶日增1538星,自主AI循环ralph爆火登榜第二
人工智能
软件供应链安全指南8 小时前
灵脉 IAST 5.4 升级:双轮驱动 AI 漏洞治理与业务逻辑漏洞精准检测
人工智能·安全
lanmengyiyu8 小时前
单塔和双塔的区别和共同点
人工智能·双塔模型·网络结构·单塔模型
微光闪现8 小时前
AI识别宠物焦虑、紧张和晕车行为,是否已经具备实际可行性?
大数据·人工智能·宠物
技术小黑屋_9 小时前
用好Few-shot Prompting,AI 准确率提升100%
人工智能
中草药z9 小时前
【嵌入模型】概念、应用与两大 AI 开源社区(Hugging Face / 魔塔)
人工智能·算法·机器学习·数据集·向量·嵌入模型
知乎的哥廷根数学学派9 小时前
基于数据驱动的自适应正交小波基优化算法(Python)
开发语言·网络·人工智能·pytorch·python·深度学习·算法
DisonTangor9 小时前
GLM-Image:面向密集知识与高保真图像生成的自回归模型
人工智能·ai作画·数据挖掘·回归·aigc