💡 128k上下文+140种语言!Gemma 3如何改写设备端AI规则?

Gemma 3 是由 Google DeepMind 推出的一系列轻量级、先进的开放模型,旨在在设备上运行。它在性能、多语言支持、文本和视觉推理能力、上下文窗口、函数调用以及量化版本等方面具有显著优势。同时,还推出了 ShieldGemma 2 用于图像安全检查。Gemma 3 可与多种工具集成,拥有庞大的生态系统,并且推出了学术项目。它代表了在普及高质量人工智能方面的新进展。

Gemma 3 的新功能:

1. 世界上最优秀的单加速器模型

Gemma 3 在其模型规模下展现出了领先的性能水平,在 LMArena 排行榜的初步人类偏好评估中,超越了 Llama-405B、DeepSeek-V3 和 o3-mini 等模型。这有助于你创建引人入胜的用户体验,并且这些应用可以在单个 GPU 或 TPU 主机上运行。

2. 支持 140 种语言,走向全球

开发能使用客户母语的应用程序。Gemma 3 提供了对超过 35 种语言的开箱即用支持,以及对超过 140 种语言的预训练支持。

3. 创建具有先进文本和视觉推理能力的人工智能

轻松开发能够分析图像、文本和短视频的应用程序,为交互式和智能应用开辟新的可能性。

4. 通过扩展的上下文窗口处理复杂任务

Gemma 3 提供了 128k 标记的上下文窗口,使你的应用程序能够处理和理解大量信息。

5. 使用函数调用创建由人工智能驱动的工作流程

Gemma 3 支持函数调用和结构化输出,帮助你实现任务自动化并构建智能代理体验。

6. 通过量化模型实现更快的高性能

Gemma 3 推出了官方量化版本,在保持高精度的同时,减小了模型大小并降低了计算要求。

此图表根据 Chatbot Arena 的埃洛(Elo)分数对人工智能模型进行排名;分数越高(数字越靠前)表明用户的偏好程度越高。圆点表示估计所需的英伟达 H100 GPU 数量。Gemma 3 270 亿参数模型排名很高,尽管其他一些模型需要多达 32 块 GPU,但它仅需单块 GPU 即可运行。

Gemma 3 的严格安全协议

Google 认为,开放模型需要进行仔细的风险评估,而Google的方法在创新与安全之间取得平衡 ------ 根据模型的能力来调整测试的强度。Gemma 3 的开发过程包括广泛的数据治理,通过微调使其与Google的安全政策保持一致,以及进行全面的基准评估。虽然对能力更强的模型进行全面测试通常有助于Google评估能力较弱的模型,但 Gemma 3 在科学、技术、工程和数学(STEM)方面增强的性能促使Google针对其在制造有害物质方面被滥用的潜在风险进行了专门评估;评估结果表明风险水平较低。

随着行业开发出更强大的模型,共同制定与风险相称的安全措施将至关重要。随着时间的推移,Google将继续学习并完善针对开放模型的安全实践。

ShieldGemma 2 为图像应用提供内置安全保障

在推出 Gemma 3 的同时,Google还发布了 ShieldGemma 2,这是一款基于 Gemma 3 构建的强大的 40 亿参数图像安全检查器。ShieldGemma 2 为图像安全提供了现成的解决方案,可针对危险内容、色情内容和暴力内容这三个安全类别输出安全标签。开发人员可以根据自身的安全需求和用户情况进一步定制 ShieldGemma 2。ShieldGemma 2 是开源的,旨在提供灵活性和可控性,它利用 Gemma 3 架构的性能和效率来推动负责任的人工智能开发。

易于集成

Gemma 3 和 ShieldGemma 2 可以无缝集成到您现有的工作流程中:

  1. 使用您喜爱的工具进行开发:Gemma 3 支持 Hugging Face Transformers、Ollama、JAX、Keras、PyTorch、Google AI Edge、UnSloth、vLLM 和 Gemma.cpp 等工具,您可以灵活地为项目选择最佳工具。
  2. 秒级开始实验:即时访问 Gemma 3 并立即开始构建。在 Google AI Studio 中探索其全部潜力,或者通过 Kaggle 或 Hugging Face 下载模型。
  3. 根据您的特定需求定制 Gemma 3:Gemma 3 附带了经过改进的代码库,其中包括用于高效微调与推理的方法。使用您首选的平台(如 Google Colab、Vertex AI,甚至是您的游戏 GPU)对模型进行训练和调整。
  4. 按您的方式进行部署:Gemma 3 提供多种部署选项,包括 Vertex AI、Cloud Run、Google GenAI API、本地环境和其他平台,让您能够灵活地为您的应用程序和基础设施选择最合适的方式。
  5. 在 NVIDIA GPU 上体验优化的性能:NVIDIA 已对 Gemma 3 模型进行了直接优化,以确保您在从 Jetson Nano 到最新的 Blackwell 芯片等各种尺寸的 GPU 上都能获得最佳性能。Gemma 3 现已列入 NVIDIA API 目录中,只需通过 API 调用即可实现快速原型制作。
  6. 在多个硬件平台上加速您的人工智能开发:Gemma 3 还针对 Google Cloud TPU 进行了优化,并通过开源的 ROCm™堆栈与 AMD GPU 集成。对于 CPU 执行,Gemma.cpp 提供了直接的解决方案。

生态丰富

Gemmaverse 是一个由社区创建的庞大的 Gemma 模型和工具生态系统,随时可为您的创新提供动力并激发灵感。例如,新加坡人工智能公司(AI Singapore)的 SEA-LION v3 打破了语言障碍,促进了整个东南亚地区的交流;INSAIT 的 BgGPT 是一款开创性的以保加利亚语为主的大型语言模型,展示了 Gemma 在支持多种语言方面的强大能力;Nexa AI 的 OmniAudio 展示了设备端人工智能的潜力,为日常设备带来了先进的音频处理能力。

为了进一步推动学术研究取得突破,Google推出了 Gemma 3 学术项目。学术研究人员可以申请 Google Cloud 代金券(每次奖励价值 10000 美元),以加速他们基于 Gemma 3 的研究。申请表从今天开始开放,将持续开放四周。请在Google的网站上申请。

开始使用

作为Google持续致力于让更多人能够使用高质量人工智能的一部分,Gemma 3 代表了Google的下一步行动。准备好探索 Gemma 3 了吗?您可以从以下方面入手:

1. 即时探索:

  • 无需设置,直接在浏览器中通过 Google AI Studio 以全精度试用 Gemma 3。
  • 直接从 Google AI Studio 获取 API 密钥,并将 Gemma 3 与 Google GenAI SDK 一起使用。

定制与构建:

  • 从 Hugging Face、Ollama 或 Kaggle 下载 Gemma 3 模型。
  • 使用 Hugging Face 的 Transformers 库或您首选的开发环境,轻松对模型进行微调并使其适应您的独特需求。

部署与扩展:

  • 使用 Vertex AI 将您定制的 Gemma 3 成果大规模推向市场。
  • 使用 Ollama 在 Cloud Run 上进行推理。
  • 从 NVIDIA API 目录中开始使用 NVIDIA NIMs。
相关推荐
胡耀超2 分钟前
霍夫圆变换全面解析(OpenCV)
人工智能·python·opencv·算法·计算机视觉·数据挖掘·数据安全
jndingxin10 分钟前
OpenCV CUDA 模块中用于在 GPU 上计算两个数组对应元素差值的绝对值函数absdiff(
人工智能·opencv·计算机视觉
jerry60910 分钟前
LLM笔记(五)概率论
人工智能·笔记·学习·概率论
硅谷秋水11 分钟前
学习以任务为中心的潜动作,随地采取行动
人工智能·深度学习·计算机视觉·语言模型·机器人
Tiny番茄40 分钟前
Multimodal models —— CLIP,LLava,QWen
人工智能
Wnq100721 小时前
工业场景轮式巡检机器人纯视觉识别导航的优势剖析与前景展望
人工智能·算法·计算机视觉·激光雷达·视觉导航·人形机器人·巡检机器人
无心水2 小时前
【程序员AI入门:模型】19.开源模型工程化全攻略:从选型部署到高效集成,LangChain与One-API双剑合璧
人工智能·langchain·开源·ai入门·程序员ai开发入门·程序员的 ai 开发第一课·程序员ai入门
有梦想的攻城狮2 小时前
大语言模型与多模态模型比较
人工智能·语言模型·自然语言处理·llm·大语言模型
九章云极AladdinEdu3 小时前
GPU与NPU异构计算任务划分算法研究:基于强化学习的Transformer负载均衡实践
java·开发语言·人工智能·深度学习·测试工具·负载均衡·transformer
量子-Alex3 小时前
【目标检测】RT-DETR
人工智能·目标检测·计算机视觉