💡 128k上下文+140种语言！Gemma 3如何改写设备端AI规则？

Gemma 3 是由 Google DeepMind 推出的一系列轻量级、先进的开放模型，旨在在设备上运行。它在性能、多语言支持、文本和视觉推理能力、上下文窗口、函数调用以及量化版本等方面具有显著优势。同时，还推出了 ShieldGemma 2 用于图像安全检查。Gemma 3 可与多种工具集成，拥有庞大的生态系统，并且推出了学术项目。它代表了在普及高质量人工智能方面的新进展。

Gemma 3 的新功能：

1. 世界上最优秀的单加速器模型

Gemma 3 在其模型规模下展现出了领先的性能水平，在 LMArena 排行榜的初步人类偏好评估中，超越了 Llama-405B、DeepSeek-V3 和 o3-mini 等模型。这有助于你创建引人入胜的用户体验，并且这些应用可以在单个 GPU 或 TPU 主机上运行。

2. 支持 140 种语言，走向全球

开发能使用客户母语的应用程序。Gemma 3 提供了对超过 35 种语言的开箱即用支持，以及对超过 140 种语言的预训练支持。

3. 创建具有先进文本和视觉推理能力的人工智能

轻松开发能够分析图像、文本和短视频的应用程序，为交互式和智能应用开辟新的可能性。

4. 通过扩展的上下文窗口处理复杂任务

Gemma 3 提供了 128k 标记的上下文窗口，使你的应用程序能够处理和理解大量信息。

5. 使用函数调用创建由人工智能驱动的工作流程

Gemma 3 支持函数调用和结构化输出，帮助你实现任务自动化并构建智能代理体验。

6. 通过量化模型实现更快的高性能

Gemma 3 推出了官方量化版本，在保持高精度的同时，减小了模型大小并降低了计算要求。

此图表根据 Chatbot Arena 的埃洛（Elo）分数对人工智能模型进行排名；分数越高（数字越靠前）表明用户的偏好程度越高。圆点表示估计所需的英伟达 H100 GPU 数量。Gemma 3 270 亿参数模型排名很高，尽管其他一些模型需要多达 32 块 GPU，但它仅需单块 GPU 即可运行。

Gemma 3 的严格安全协议

Google 认为，开放模型需要进行仔细的风险评估，而Google的方法在创新与安全之间取得平衡 ------ 根据模型的能力来调整测试的强度。Gemma 3 的开发过程包括广泛的数据治理，通过微调使其与Google的安全政策保持一致，以及进行全面的基准评估。虽然对能力更强的模型进行全面测试通常有助于Google评估能力较弱的模型，但 Gemma 3 在科学、技术、工程和数学（STEM）方面增强的性能促使Google针对其在制造有害物质方面被滥用的潜在风险进行了专门评估；评估结果表明风险水平较低。

随着行业开发出更强大的模型，共同制定与风险相称的安全措施将至关重要。随着时间的推移，Google将继续学习并完善针对开放模型的安全实践。

ShieldGemma 2 为图像应用提供内置安全保障

在推出 Gemma 3 的同时，Google还发布了 ShieldGemma 2，这是一款基于 Gemma 3 构建的强大的 40 亿参数图像安全检查器。ShieldGemma 2 为图像安全提供了现成的解决方案，可针对危险内容、色情内容和暴力内容这三个安全类别输出安全标签。开发人员可以根据自身的安全需求和用户情况进一步定制 ShieldGemma 2。ShieldGemma 2 是开源的，旨在提供灵活性和可控性，它利用 Gemma 3 架构的性能和效率来推动负责任的人工智能开发。

易于集成

Gemma 3 和 ShieldGemma 2 可以无缝集成到您现有的工作流程中：

使用您喜爱的工具进行开发：Gemma 3 支持 Hugging Face Transformers、Ollama、JAX、Keras、PyTorch、Google AI Edge、UnSloth、vLLM 和 Gemma.cpp 等工具，您可以灵活地为项目选择最佳工具。
秒级开始实验：即时访问 Gemma 3 并立即开始构建。在 Google AI Studio 中探索其全部潜力，或者通过 Kaggle 或 Hugging Face 下载模型。
根据您的特定需求定制 Gemma 3：Gemma 3 附带了经过改进的代码库，其中包括用于高效微调与推理的方法。使用您首选的平台（如 Google Colab、Vertex AI，甚至是您的游戏 GPU）对模型进行训练和调整。
按您的方式进行部署：Gemma 3 提供多种部署选项，包括 Vertex AI、Cloud Run、Google GenAI API、本地环境和其他平台，让您能够灵活地为您的应用程序和基础设施选择最合适的方式。
在 NVIDIA GPU 上体验优化的性能：NVIDIA 已对 Gemma 3 模型进行了直接优化，以确保您在从 Jetson Nano 到最新的 Blackwell 芯片等各种尺寸的 GPU 上都能获得最佳性能。Gemma 3 现已列入 NVIDIA API 目录中，只需通过 API 调用即可实现快速原型制作。
在多个硬件平台上加速您的人工智能开发：Gemma 3 还针对 Google Cloud TPU 进行了优化，并通过开源的 ROCm™堆栈与 AMD GPU 集成。对于 CPU 执行，Gemma.cpp 提供了直接的解决方案。

生态丰富

Gemmaverse 是一个由社区创建的庞大的 Gemma 模型和工具生态系统，随时可为您的创新提供动力并激发灵感。例如，新加坡人工智能公司（AI Singapore）的 SEA-LION v3 打破了语言障碍，促进了整个东南亚地区的交流；INSAIT 的 BgGPT 是一款开创性的以保加利亚语为主的大型语言模型，展示了 Gemma 在支持多种语言方面的强大能力；Nexa AI 的 OmniAudio 展示了设备端人工智能的潜力，为日常设备带来了先进的音频处理能力。

为了进一步推动学术研究取得突破，Google推出了 Gemma 3 学术项目。学术研究人员可以申请 Google Cloud 代金券（每次奖励价值 10000 美元），以加速他们基于 Gemma 3 的研究。申请表从今天开始开放，将持续开放四周。请在Google的网站上申请。

开始使用

作为Google持续致力于让更多人能够使用高质量人工智能的一部分，Gemma 3 代表了Google的下一步行动。准备好探索 Gemma 3 了吗？您可以从以下方面入手：

1. 即时探索：

无需设置，直接在浏览器中通过 Google AI Studio 以全精度试用 Gemma 3。
直接从 Google AI Studio 获取 API 密钥，并将 Gemma 3 与 Google GenAI SDK 一起使用。

定制与构建：

从 Hugging Face、Ollama 或 Kaggle 下载 Gemma 3 模型。
使用 Hugging Face 的 Transformers 库或您首选的开发环境，轻松对模型进行微调并使其适应您的独特需求。

部署与扩展：

使用 Vertex AI 将您定制的 Gemma 3 成果大规模推向市场。
使用 Ollama 在 Cloud Run 上进行推理。
从 NVIDIA API 目录中开始使用 NVIDIA NIMs。