谷歌 Gemini 2.5 全线爆发!勇战「濒死恐慌」,却被丝血宝可梦吓到当场宕机

【新智元导读】今天,谷歌旗舰 Gemini 2.5 三箭齐发,首次亮相轻量版 2.5 Flash-Lite。最新 70 页技术报告中,爆料了 Gemini 2.5 在玩宝可梦濒死时,惊现类人的恐慌,导致推理性能直线下降。

昨夜,Gemini 2.5 全家桶三款模型,正式上线。

Gemini 2.5 Pro (正式版,与 0605 预览版相比无明显变化)

Gemini 2.5 Flash(正式版,与 0520 预览版相比定价有变)

Gemini 2.5 Flash-Lite(预览版,最小推理模型)

这次,Gemini 2.5 Flash 和 Gemini 2.5 Pro 正式版上线,与谷歌 I/O 大会公布的预览版性能无明显变化。

2.5 Flash-Lite 预览版则是速度最快、性价比最高的 Gemini 2.5 系模型。

未开启思考模式,Flash-Lite 版输入价格仅为 0.1 美元 / 百万 token,输出价格 0.4 美元 / 百万 token。

基准测试显示,2.5 Flash-Lite 版(开启思考模式)在数学、知识问答、编码、视觉理解、多语种性能上,足以媲美 2.5 Flash。

相较于上一代,2.5 Flash-Lite 性能提升显著,尤其是在数学、编码任务中。

在 LMArena 榜单中,Gemini-2.5-Flash-Lite 在文本竞技场中位列第 12,创意写作中第 3,编程中第 14,在 Hard Prompt 中第 17。

左右滑动查看

谷歌 VP 一个 demo 告诉你,2.5 Flash-Lite 输出速度,能快到实时编写每个界面的代码。

视频详情

它还通过了物理模拟测试。

参考资料:

storage.googleapis.com/deepmind-me...

x.com/sundarpicha...

blog.google/products/ge...

developers.googleblog.com/en/gemini-2...

相关推荐
Shawn_Shawn7 小时前
mcp学习笔记(一)-mcp核心概念梳理
人工智能·llm·mcp
33三 三like9 小时前
《基于知识图谱和智能推荐的养老志愿服务系统》开发日志
人工智能·知识图谱
芝士爱知识a9 小时前
【工具推荐】2026公考App横向评测:粉笔、华图与智蛙面试App功能对比
人工智能·软件推荐·ai教育·结构化面试·公考app·智蛙面试app·公考上岸
腾讯云开发者10 小时前
港科大熊辉|AI时代的职场新坐标——为什么你应该去“数据稀疏“的地方?
人工智能
工程师老罗10 小时前
YoloV1数据集格式转换,VOC XML→YOLOv1张量
xml·人工智能·yolo
win4r10 小时前
🚀OpenClaw高级使用经验分享!2026年最强生产力!五分钟打造多Agent协作编程开发团队!模型容灾机制深度配置+云端Gateway操控本地macOS!
aigc·openai·ai编程
Coder_Boy_10 小时前
技术让开发更轻松的底层矛盾
java·大数据·数据库·人工智能·深度学习
啊森要自信11 小时前
CANN ops-cv:面向计算机视觉的 AI 硬件端高效算子库核心架构与开发逻辑
人工智能·计算机视觉·架构·cann
2401_8362358611 小时前
中安未来SDK15:以AI之眼,解锁企业档案的数字化基因
人工智能·科技·深度学习·ocr·生活