谷歌 Gemini 2.5 全线爆发!勇战「濒死恐慌」,却被丝血宝可梦吓到当场宕机

【新智元导读】今天,谷歌旗舰 Gemini 2.5 三箭齐发,首次亮相轻量版 2.5 Flash-Lite。最新 70 页技术报告中,爆料了 Gemini 2.5 在玩宝可梦濒死时,惊现类人的恐慌,导致推理性能直线下降。

昨夜,Gemini 2.5 全家桶三款模型,正式上线。

Gemini 2.5 Pro (正式版,与 0605 预览版相比无明显变化)

Gemini 2.5 Flash(正式版,与 0520 预览版相比定价有变)

Gemini 2.5 Flash-Lite(预览版,最小推理模型)

这次,Gemini 2.5 Flash 和 Gemini 2.5 Pro 正式版上线,与谷歌 I/O 大会公布的预览版性能无明显变化。

2.5 Flash-Lite 预览版则是速度最快、性价比最高的 Gemini 2.5 系模型。

未开启思考模式,Flash-Lite 版输入价格仅为 0.1 美元 / 百万 token,输出价格 0.4 美元 / 百万 token。

基准测试显示,2.5 Flash-Lite 版(开启思考模式)在数学、知识问答、编码、视觉理解、多语种性能上,足以媲美 2.5 Flash。

相较于上一代,2.5 Flash-Lite 性能提升显著,尤其是在数学、编码任务中。

在 LMArena 榜单中,Gemini-2.5-Flash-Lite 在文本竞技场中位列第 12,创意写作中第 3,编程中第 14,在 Hard Prompt 中第 17。

左右滑动查看

谷歌 VP 一个 demo 告诉你,2.5 Flash-Lite 输出速度,能快到实时编写每个界面的代码。

视频详情

它还通过了物理模拟测试。

参考资料:

storage.googleapis.com/deepmind-me...

x.com/sundarpicha...

blog.google/products/ge...

developers.googleblog.com/en/gemini-2...

相关推荐
柠檬味拥抱16 分钟前
面向边缘智能的MCP Bridge轻量化适配策略研究与实现
人工智能
学境思源AcademicIdeas24 分钟前
如何使用ChatGPT快速完成一篇论文初稿?
人工智能·chatgpt
人类发明了工具29 分钟前
【强化学习】PPO(Proximal Policy Optimization,近端策略优化)算法
人工智能·算法·机器学习·ppo·近端策略优化算法
ShanHai山海36 分钟前
SpringAI+DeepSeek-了解AI和大模型应用
人工智能
墨家巨子@俏如来38 分钟前
二.干货干货!!!SpringAI入门到实战-记忆存储和会话隔离
人工智能·springai
西猫雷婶39 分钟前
python学智能算法(十二)|机器学习朴素贝叶斯方法初步-拉普拉斯平滑计算条件概率
开发语言·人工智能·python·深度学习·机器学习·矩阵
大师兄带你刨AI1 小时前
「AI大数据」| 《华为:面向智能制造的工业大模型标准化研究报告》
大数据·人工智能
武汉唯众智创1 小时前
基于人工智能的物联网全栈智能应用实训系统实训室解决方案
人工智能·物联网·物联网实训室·物联网实验室·物联网全栈实训室·物联网全栈智能应用实训系统·物联网全栈智能实训室
F36_9_1 小时前
如何高效实现公司文件管理
大数据·数据库·人工智能
爱写代码的小朋友1 小时前
融入未来:人工智能在普通高中通识教育中的价值、路径与挑战
人工智能·高中教育·人工智能通识教育