谷歌 Gemini 2.5 全线爆发!勇战「濒死恐慌」,却被丝血宝可梦吓到当场宕机

【新智元导读】今天,谷歌旗舰 Gemini 2.5 三箭齐发,首次亮相轻量版 2.5 Flash-Lite。最新 70 页技术报告中,爆料了 Gemini 2.5 在玩宝可梦濒死时,惊现类人的恐慌,导致推理性能直线下降。

昨夜,Gemini 2.5 全家桶三款模型,正式上线。

Gemini 2.5 Pro (正式版,与 0605 预览版相比无明显变化)

Gemini 2.5 Flash(正式版,与 0520 预览版相比定价有变)

Gemini 2.5 Flash-Lite(预览版,最小推理模型)

这次,Gemini 2.5 Flash 和 Gemini 2.5 Pro 正式版上线,与谷歌 I/O 大会公布的预览版性能无明显变化。

2.5 Flash-Lite 预览版则是速度最快、性价比最高的 Gemini 2.5 系模型。

未开启思考模式,Flash-Lite 版输入价格仅为 0.1 美元 / 百万 token,输出价格 0.4 美元 / 百万 token。

基准测试显示,2.5 Flash-Lite 版(开启思考模式)在数学、知识问答、编码、视觉理解、多语种性能上,足以媲美 2.5 Flash。

相较于上一代,2.5 Flash-Lite 性能提升显著,尤其是在数学、编码任务中。

在 LMArena 榜单中,Gemini-2.5-Flash-Lite 在文本竞技场中位列第 12,创意写作中第 3,编程中第 14,在 Hard Prompt 中第 17。

左右滑动查看

谷歌 VP 一个 demo 告诉你,2.5 Flash-Lite 输出速度,能快到实时编写每个界面的代码。

视频详情

它还通过了物理模拟测试。

参考资料:

storage.googleapis.com/deepmind-me...

x.com/sundarpicha...

blog.google/products/ge...

developers.googleblog.com/en/gemini-2...

相关推荐
张较瘦_17 分钟前
[论文阅读] 人工智能 + 软件工程 | 用交互式可视化革新软件文档:Helveg工具的设计与改进
人工智能·软件工程
阿里云大数据AI技术25 分钟前
【ICML2025】大模型训练性能4倍提升!阿里云PAI团队研究成果ChunkFlow中选
大数据·人工智能·机器学习
weixin_4481199433 分钟前
Datawhale AI数据分析 笔记
人工智能·笔记
楽码35 分钟前
MIT有研究表示使用人工智能导致智力下降
后端·llm·openai
OpenBayes贝式计算37 分钟前
OpenBayes 教程上新丨一句话精准P图,FLUX.1 Kontext可实现图像编辑/风格迁移/文本编辑/角色一致性编辑
人工智能·深度学习·机器学习
galaxylove43 分钟前
Gartner发布2025年中国网络安全成熟度曲线:网络安全的重点正转向保护AI、推动业务转型和增强组织韧性
人工智能·安全·web安全
贾全1 小时前
深入理解大语言模型:从核心技术到极简实现
人工智能·python·语言模型
duration~1 小时前
Spring AI快速入门
java·人工智能·后端·spring·flask
CH3_CH2_CHO1 小时前
EP02:【NLP 第二弹】自然语言处理数据
人工智能·自然语言处理
Listennnn2 小时前
大语言模型(LLM)训练的教师强制(Teacher Forcing)方法
人工智能·语言模型·自然语言处理