Gemini 3.1 Flash-Lite 正式上线:专为规模化智能而生

内容来源于谷歌官方,由谷歌云谷歌地图合作伙伴 CloudAce 深圳云一进行翻译发布。

导语: Google 扩展了 Gemini 3 模型家族,正式推出 Gemini 3.1 Flash-Lite 。作为该系列中速度最快、性价比最高的模型,它专为应对大规模高容量的开发工作负载而设计,在模型等级与价格平衡方面树立了新的行业标杆 。

目前,开发者已可通过 Google AI Studio 中的 Gemini API 接入预览版,企业级用户则可同步通过 Vertex AI 平台进行部署 。

性能更强

在实时交互与高频工作流中,低延迟是应用成功的关键。根据最新的基准测试,Gemini 3.1 Flash-Lite 在保持甚至超越前代模型质量的同时,实现了性能的飞跃:

  • 极速响应 :其首个答案 Token 生成时间(Time to First Answer Token)比 2.5 Flash 快 2.5 倍
  • 高效输出 :输出速度提升了 45%
  • 实时体验:这种超低延迟特性使其成为构建高响应、实时交互体验的理想底座 。

Gemini 3.1 Flash-Lite 在速度和质量方面都优于 2.5 Flash

成本更低

对于需要处理 PB 级数据或海量用户请求的企业而言,3.1 Flash-Lite 提供了极具破坏力的定价模型,将先进智能的获取成本降至更低 :

  • 输入成本 :仅需 $0.25 / 100万 tokens
  • 输出成本 :仅需 $1.50 / 100万 tokens

表现更好

Gemini 3.1 Flash-Lite 在 Arena.ai 排行榜上取得了令人印象深刻的 1432 Elo 分数,并在推理和多模态理解基准测试中超越了同级别的其他模型,包括在 GPQA Diamond 上获得 86.9% 的分数,在 MMMU Pro 上获得 76.8% 的分数------甚至超越了前几代更大的 Gemini 模型,如 2.5 Flash。

Gemini 3.1 Flash-Lite 分数表现

适应的规模化智能

为了赋予开发者更精细的控制力,3.1 Flash-Lite 在 AI Studio 和 Vertex AI 中标配了 "思考等级(Thinking Levels)" 功能 。开发者可以根据具体任务的复杂程度,灵活调节模型的推理深度:

  • 成本优先任务:处理海量翻译、内容审核等高重复性、大规模任务 。
  • 逻辑优先任务:应对复杂的 UI/仪表盘生成、模拟创建或精准遵循复杂指令 。

目前,已有包括 Latitude、CartwheelWhering 在内的多家先锋企业正利用 3.1 Flash-Lite 解决大规模的复杂业务挑战 。

Gemini 3.1 Flash-Lite 可瞬间为电商线框图填充数百种不同类别的产品

关于 Cloud Ace

Cloud Ace 是在 Google Cloud 领域拥有顶尖业绩的系统集成商,**在 Google Cloud 的 Service(服务)及 Co-sell(联合销售)两大核心领域,成功获得最高等级 Diamond 合作伙伴认证 ,提供从云端架构设计、运维支持、系统开发到生成式 AI 应用的一站式服务,**并为企业提供从战略规划到实施落地、到运营维护的 AX 与 DX(数字化转型)一站式支持。

**Cloud Ace 集团拥有 500 多名工程师,**包括多名入选 Google Cloud Partner Top Engineer 的顶尖工程师,以及大批深耕行业多年的技术专家。

凭借卓越的技术实力与服务品质,连续多年荣获 Google Cloud 年度合作伙伴、 Google Maps Platform 合作伙伴等多项认证。

如果您希望了解如何将 Gemini 3.1 Flash-Lite 引入您的业务架构,实现从"降本增效"到"体验升级"的飞跃,欢迎咨询我们

相关推荐
ishangy3 分钟前
皮带撕裂早期特征提取:AI摄像机+深度学习在港口的应用
人工智能·深度学习·智慧港口·港口皮带ai识别·皮带检测识别
imbackneverdie9 分钟前
一天怎么完成论文初稿
人工智能·自然语言处理·aigc·ai写作·论文写作·论文投稿·科研工具
1892280486112 分钟前
H27QCG8T2ELR-BCF海力士H27QCG8UDBIR-BCB
大数据·服务器·人工智能·科技·缓存
财经资讯数据_灵砚智能21 分钟前
基于全球经济类多源新闻的NLP情感分析与数据可视化(夜间-次晨)2026年5月10日
大数据·人工智能·python·信息可视化·自然语言处理
kcuwu.22 分钟前
深度学习技术完全指南
人工智能·深度学习
用户51914958484527 分钟前
图片上传绕过与存储型XSS漏洞利用技术详解
人工智能·aigc
我滴老baby28 分钟前
0基础速通Python+AI|2026热门轻量化玩法全攻略:从入门到实战,3天搞定AI应用开发
开发语言·人工智能·python
舞影天上29 分钟前
在 Windows 上优雅地启动 Hermes Agent Web Dashboard
人工智能
XD74297163630 分钟前
科技早报晚报|2026年5月11日:AI 工具链开始从“能用”走向“可治理”,今天更值得二次开发的 3 个机会
人工智能·科技·科技新闻·ai agent·开发者工具
lizhihai_9930 分钟前
股市学习心得-智能体顶层设计文件收益供应链
大数据·人工智能·学习