
【新智元导读】今天,谷歌旗舰 Gemini 2.5 三箭齐发,首次亮相轻量版 2.5 Flash-Lite。最新 70 页技术报告中,爆料了 Gemini 2.5 在玩宝可梦濒死时,惊现类人的恐慌,导致推理性能直线下降。
昨夜,Gemini 2.5 全家桶三款模型,正式上线。
Gemini 2.5 Pro (正式版,与 0605 预览版相比无明显变化)
Gemini 2.5 Flash(正式版,与 0520 预览版相比定价有变)
Gemini 2.5 Flash-Lite(预览版,最小推理模型)

这次,Gemini 2.5 Flash 和 Gemini 2.5 Pro 正式版上线,与谷歌 I/O 大会公布的预览版性能无明显变化。
2.5 Flash-Lite 预览版则是速度最快、性价比最高的 Gemini 2.5 系模型。
未开启思考模式,Flash-Lite 版输入价格仅为 0.1 美元 / 百万 token,输出价格 0.4 美元 / 百万 token。

基准测试显示,2.5 Flash-Lite 版(开启思考模式)在数学、知识问答、编码、视觉理解、多语种性能上,足以媲美 2.5 Flash。
相较于上一代,2.5 Flash-Lite 性能提升显著,尤其是在数学、编码任务中。
在 LMArena 榜单中,Gemini-2.5-Flash-Lite 在文本竞技场中位列第 12,创意写作中第 3,编程中第 14,在 Hard Prompt 中第 17。



左右滑动查看
谷歌 VP 一个 demo 告诉你,2.5 Flash-Lite 输出速度,能快到实时编写每个界面的代码。
它还通过了物理模拟测试。


参考资料: