Gemini 3.1 Flash-Lite 正式上线:专为规模化智能而生

内容来源于谷歌官方,由谷歌云谷歌地图合作伙伴 CloudAce 深圳云一进行翻译发布。

导语: Google 扩展了 Gemini 3 模型家族,正式推出 Gemini 3.1 Flash-Lite 。作为该系列中速度最快、性价比最高的模型,它专为应对大规模高容量的开发工作负载而设计,在模型等级与价格平衡方面树立了新的行业标杆 。

目前,开发者已可通过 Google AI Studio 中的 Gemini API 接入预览版,企业级用户则可同步通过 Vertex AI 平台进行部署 。

性能更强

在实时交互与高频工作流中,低延迟是应用成功的关键。根据最新的基准测试,Gemini 3.1 Flash-Lite 在保持甚至超越前代模型质量的同时,实现了性能的飞跃:

  • 极速响应 :其首个答案 Token 生成时间(Time to First Answer Token)比 2.5 Flash 快 2.5 倍
  • 高效输出 :输出速度提升了 45%
  • 实时体验:这种超低延迟特性使其成为构建高响应、实时交互体验的理想底座 。

Gemini 3.1 Flash-Lite 在速度和质量方面都优于 2.5 Flash

成本更低

对于需要处理 PB 级数据或海量用户请求的企业而言,3.1 Flash-Lite 提供了极具破坏力的定价模型,将先进智能的获取成本降至更低 :

  • 输入成本 :仅需 $0.25 / 100万 tokens
  • 输出成本 :仅需 $1.50 / 100万 tokens

表现更好

Gemini 3.1 Flash-Lite 在 Arena.ai 排行榜上取得了令人印象深刻的 1432 Elo 分数,并在推理和多模态理解基准测试中超越了同级别的其他模型,包括在 GPQA Diamond 上获得 86.9% 的分数,在 MMMU Pro 上获得 76.8% 的分数------甚至超越了前几代更大的 Gemini 模型,如 2.5 Flash。

Gemini 3.1 Flash-Lite 分数表现

适应的规模化智能

为了赋予开发者更精细的控制力,3.1 Flash-Lite 在 AI Studio 和 Vertex AI 中标配了 "思考等级(Thinking Levels)" 功能 。开发者可以根据具体任务的复杂程度,灵活调节模型的推理深度:

  • 成本优先任务:处理海量翻译、内容审核等高重复性、大规模任务 。
  • 逻辑优先任务:应对复杂的 UI/仪表盘生成、模拟创建或精准遵循复杂指令 。

目前,已有包括 Latitude、CartwheelWhering 在内的多家先锋企业正利用 3.1 Flash-Lite 解决大规模的复杂业务挑战 。

Gemini 3.1 Flash-Lite 可瞬间为电商线框图填充数百种不同类别的产品

关于 Cloud Ace

Cloud Ace 是在 Google Cloud 领域拥有顶尖业绩的系统集成商,**在 Google Cloud 的 Service(服务)及 Co-sell(联合销售)两大核心领域,成功获得最高等级 Diamond 合作伙伴认证 ,提供从云端架构设计、运维支持、系统开发到生成式 AI 应用的一站式服务,**并为企业提供从战略规划到实施落地、到运营维护的 AX 与 DX(数字化转型)一站式支持。

**Cloud Ace 集团拥有 500 多名工程师,**包括多名入选 Google Cloud Partner Top Engineer 的顶尖工程师,以及大批深耕行业多年的技术专家。

凭借卓越的技术实力与服务品质,连续多年荣获 Google Cloud 年度合作伙伴、 Google Maps Platform 合作伙伴等多项认证。

如果您希望了解如何将 Gemini 3.1 Flash-Lite 引入您的业务架构,实现从"降本增效"到"体验升级"的飞跃,欢迎咨询我们

相关推荐
北芝科技1 小时前
2026年AI营销公司推荐:广州GEO服务品牌多维度对比
人工智能·搜索引擎
Try, Again1 小时前
【小龙虾-OpenClaw】Railway如何部署小龙虾-OpenClaw
人工智能
带娃的IT创业者1 小时前
专栏系列3.3《时序关联学习:r=0.733 背后的记忆形成》
人工智能·深度学习·神经网络·时序学习·nct·神经调质
格林威1 小时前
工业相机图像高速存储(C++版):先存内存,后批量转存方法,附堡盟相机实战代码!
开发语言·c++·人工智能·数码相机·计算机视觉·视觉检测·堡盟相机
程序员夏末1 小时前
【AI Agent基础 | 第四篇】Spring AI 集成与多模型支持
java·人工智能·spring·ai·ai agent
徐礼昭|商派软件市场负责人1 小时前
“80%应用将消亡”?后App时代:AI智能体重构人机交互与数字商业新秩
大数据·人工智能·人机交互·零售·智能搜索·ai推荐
快乐非自愿1 小时前
NIO核心原理深度解析:非阻塞I/O的块式设计与高并发实现逻辑
人工智能·深度学习·nio
十铭忘1 小时前
EgoPoseFormer v2:解决 AR/VR 场景中的第一视角人体动捕问题
人工智能·计算机视觉·ar·vr
东离与糖宝1 小时前
Gradle 9.4爆改Java构建:编译速度提升300%,微服务多模块一键优化
java·人工智能