Gemini 3.1 Flash-Lite 正式上线:专为规模化智能而生

内容来源于谷歌官方,由谷歌云谷歌地图合作伙伴 CloudAce 深圳云一进行翻译发布。

导语: Google 扩展了 Gemini 3 模型家族,正式推出 Gemini 3.1 Flash-Lite 。作为该系列中速度最快、性价比最高的模型,它专为应对大规模高容量的开发工作负载而设计,在模型等级与价格平衡方面树立了新的行业标杆 。

目前,开发者已可通过 Google AI Studio 中的 Gemini API 接入预览版,企业级用户则可同步通过 Vertex AI 平台进行部署 。

性能更强

在实时交互与高频工作流中,低延迟是应用成功的关键。根据最新的基准测试,Gemini 3.1 Flash-Lite 在保持甚至超越前代模型质量的同时,实现了性能的飞跃:

  • 极速响应 :其首个答案 Token 生成时间(Time to First Answer Token)比 2.5 Flash 快 2.5 倍
  • 高效输出 :输出速度提升了 45%
  • 实时体验:这种超低延迟特性使其成为构建高响应、实时交互体验的理想底座 。

Gemini 3.1 Flash-Lite 在速度和质量方面都优于 2.5 Flash

成本更低

对于需要处理 PB 级数据或海量用户请求的企业而言,3.1 Flash-Lite 提供了极具破坏力的定价模型,将先进智能的获取成本降至更低 :

  • 输入成本 :仅需 $0.25 / 100万 tokens
  • 输出成本 :仅需 $1.50 / 100万 tokens

表现更好

Gemini 3.1 Flash-Lite 在 Arena.ai 排行榜上取得了令人印象深刻的 1432 Elo 分数,并在推理和多模态理解基准测试中超越了同级别的其他模型,包括在 GPQA Diamond 上获得 86.9% 的分数,在 MMMU Pro 上获得 76.8% 的分数------甚至超越了前几代更大的 Gemini 模型,如 2.5 Flash。

Gemini 3.1 Flash-Lite 分数表现

适应的规模化智能

为了赋予开发者更精细的控制力,3.1 Flash-Lite 在 AI Studio 和 Vertex AI 中标配了 "思考等级(Thinking Levels)" 功能 。开发者可以根据具体任务的复杂程度,灵活调节模型的推理深度:

  • 成本优先任务:处理海量翻译、内容审核等高重复性、大规模任务 。
  • 逻辑优先任务:应对复杂的 UI/仪表盘生成、模拟创建或精准遵循复杂指令 。

目前,已有包括 Latitude、CartwheelWhering 在内的多家先锋企业正利用 3.1 Flash-Lite 解决大规模的复杂业务挑战 。

Gemini 3.1 Flash-Lite 可瞬间为电商线框图填充数百种不同类别的产品

关于 Cloud Ace

Cloud Ace 是在 Google Cloud 领域拥有顶尖业绩的系统集成商,**在 Google Cloud 的 Service(服务)及 Co-sell(联合销售)两大核心领域,成功获得最高等级 Diamond 合作伙伴认证 ,提供从云端架构设计、运维支持、系统开发到生成式 AI 应用的一站式服务,**并为企业提供从战略规划到实施落地、到运营维护的 AX 与 DX(数字化转型)一站式支持。

**Cloud Ace 集团拥有 500 多名工程师,**包括多名入选 Google Cloud Partner Top Engineer 的顶尖工程师,以及大批深耕行业多年的技术专家。

凭借卓越的技术实力与服务品质,连续多年荣获 Google Cloud 年度合作伙伴、 Google Maps Platform 合作伙伴等多项认证。

如果您希望了解如何将 Gemini 3.1 Flash-Lite 引入您的业务架构,实现从"降本增效"到"体验升级"的飞跃,欢迎咨询我们

相关推荐
AI创界者10 分钟前
零门槛部署!MOSS-TTS 语音合成与音色克隆本地整合包发布(支持 API/低显存)
人工智能
IT 行者19 分钟前
LangChain4j 集成 Redis 向量存储:我踩过的坑和选型建议
java·人工智能·redis·后端
YuanDaima204820 分钟前
LangChain基础配置与对话模型实战
人工智能·python·langchain·大模型·智能体·langgraph
团子和二花26 分钟前
Mem0:给 AI Agent 装上「长期记忆」
人工智能
chase。28 分钟前
【学习笔记】基于扩散模型的运动规划学习与适应
人工智能·笔记·学习
机器觉醒时代30 分钟前
RL Token:破解 VLA “最后一厘米”精度难题,在线强化学习实现机器人精准操控
人工智能·机器人·强化学习·具身智能·vla模型
Thomas.Sir31 分钟前
第三章:RAG知识库开发之【RAG系统工作流程详细解析:从数据源到智能问答的全链路实战指南】
人工智能·ai·rag·离线处理·在线查询
电子科技圈40 分钟前
Durin:Aliro标准赋能,打造无缝移动入户体验
人工智能·mcu·物联网·网络协议·智能家居·智能硬件·iot
AI先驱体验官1 小时前
AI智能体赛道新机遇:2026机会与挑战深度解析
大数据·人工智能·深度学习·重构·aigc
YUNDUANNET1 小时前
AI驱动,不止于概念 | VeryCloud联合亚马逊云科技深度解读OpenClaw开发范式革命
人工智能·科技·openclaw