Gemini 3.1 Flash-Lite 正式上线：专为规模化智能而生

内容来源于谷歌官方，由谷歌云谷歌地图合作伙伴 CloudAce 深圳云一进行翻译发布。

导语： Google 扩展了 Gemini 3 模型家族，正式推出 Gemini 3.1 Flash-Lite 。作为该系列中速度最快、性价比最高的模型，它专为应对大规模高容量的开发工作负载而设计，在模型等级与价格平衡方面树立了新的行业标杆。

目前，开发者已可通过 Google AI Studio 中的 Gemini API 接入预览版，企业级用户则可同步通过 Vertex AI 平台进行部署。

性能更强

在实时交互与高频工作流中，低延迟是应用成功的关键。根据最新的基准测试，Gemini 3.1 Flash-Lite 在保持甚至超越前代模型质量的同时，实现了性能的飞跃：

极速响应 ：其首个答案 Token 生成时间（Time to First Answer Token）比 2.5 Flash 快 2.5 倍 。
高效输出 ：输出速度提升了 45% 。
实时体验：这种超低延迟特性使其成为构建高响应、实时交互体验的理想底座。

Gemini 3.1 Flash-Lite 在速度和质量方面都优于 2.5 Flash

成本更低

对于需要处理 PB 级数据或海量用户请求的企业而言，3.1 Flash-Lite 提供了极具破坏力的定价模型，将先进智能的获取成本降至更低：

输入成本 ：仅需 $0.25 / 100万 tokens 。
输出成本 ：仅需 $1.50 / 100万 tokens 。

表现更好

Gemini 3.1 Flash-Lite 在 Arena.ai 排行榜上取得了令人印象深刻的 1432 Elo 分数，并在推理和多模态理解基准测试中超越了同级别的其他模型，包括在 GPQA Diamond 上获得 86.9% 的分数，在 MMMU Pro 上获得 76.8% 的分数------甚至超越了前几代更大的 Gemini 模型，如 2.5 Flash。

Gemini 3.1 Flash-Lite 分数表现

自适应的规模化智能

为了赋予开发者更精细的控制力，3.1 Flash-Lite 在 AI Studio 和 Vertex AI 中标配了 "思考等级（Thinking Levels）" 功能。开发者可以根据具体任务的复杂程度，灵活调节模型的推理深度：

成本优先任务：处理海量翻译、内容审核等高重复性、大规模任务。
逻辑优先任务：应对复杂的 UI/仪表盘生成、模拟创建或精准遵循复杂指令。

目前，已有包括 Latitude、Cartwheel 和 Whering 在内的多家先锋企业正利用 3.1 Flash-Lite 解决大规模的复杂业务挑战。

Gemini 3.1 Flash-Lite 可瞬间为电商线框图填充数百种不同类别的产品

关于 Cloud Ace

Cloud Ace 是在 Google Cloud 领域拥有顶尖业绩的系统集成商，**在 Google Cloud 的 Service（服务）及 Co-sell（联合销售）两大核心领域，成功获得最高等级 Diamond 合作伙伴认证，提供从云端架构设计、运维支持、系统开发到生成式 AI 应用的一站式服务，**并为企业提供从战略规划到实施落地、到运营维护的 AX 与 DX（数字化转型）一站式支持。

**Cloud Ace 集团拥有 500 多名工程师，**包括多名入选 Google Cloud Partner Top Engineer 的顶尖工程师，以及大批深耕行业多年的技术专家。

凭借卓越的技术实力与服务品质，连续多年荣获 Google Cloud 年度合作伙伴、 Google Maps Platform 合作伙伴等多项认证。

如果您希望了解如何将 Gemini 3.1 Flash-Lite 引入您的业务架构，实现从"降本增效"到"体验升级"的飞跃，欢迎咨询我们