Gemma 3 是由 Google DeepMind 推出的一系列轻量级、先进的开放模型,旨在在设备上运行。它在性能、多语言支持、文本和视觉推理能力、上下文窗口、函数调用以及量化版本等方面具有显著优势。同时,还推出了 ShieldGemma 2 用于图像安全检查。Gemma 3 可与多种工具集成,拥有庞大的生态系统,并且推出了学术项目。它代表了在普及高质量人工智能方面的新进展。
Gemma 3 的新功能:
1. 世界上最优秀的单加速器模型
Gemma 3 在其模型规模下展现出了领先的性能水平,在 LMArena 排行榜的初步人类偏好评估中,超越了 Llama-405B、DeepSeek-V3 和 o3-mini 等模型。这有助于你创建引人入胜的用户体验,并且这些应用可以在单个 GPU 或 TPU 主机上运行。
2. 支持 140 种语言,走向全球
开发能使用客户母语的应用程序。Gemma 3 提供了对超过 35 种语言的开箱即用支持,以及对超过 140 种语言的预训练支持。
3. 创建具有先进文本和视觉推理能力的人工智能
轻松开发能够分析图像、文本和短视频的应用程序,为交互式和智能应用开辟新的可能性。
4. 通过扩展的上下文窗口处理复杂任务
Gemma 3 提供了 128k 标记的上下文窗口,使你的应用程序能够处理和理解大量信息。
5. 使用函数调用创建由人工智能驱动的工作流程
Gemma 3 支持函数调用和结构化输出,帮助你实现任务自动化并构建智能代理体验。
6. 通过量化模型实现更快的高性能
Gemma 3 推出了官方量化版本,在保持高精度的同时,减小了模型大小并降低了计算要求。
此图表根据 Chatbot Arena 的埃洛(Elo)分数对人工智能模型进行排名;分数越高(数字越靠前)表明用户的偏好程度越高。圆点表示估计所需的英伟达 H100 GPU 数量。Gemma 3 270 亿参数模型排名很高,尽管其他一些模型需要多达 32 块 GPU,但它仅需单块 GPU 即可运行。
Gemma 3 的严格安全协议
Google 认为,开放模型需要进行仔细的风险评估,而Google的方法在创新与安全之间取得平衡 ------ 根据模型的能力来调整测试的强度。Gemma 3 的开发过程包括广泛的数据治理,通过微调使其与Google的安全政策保持一致,以及进行全面的基准评估。虽然对能力更强的模型进行全面测试通常有助于Google评估能力较弱的模型,但 Gemma 3 在科学、技术、工程和数学(STEM)方面增强的性能促使Google针对其在制造有害物质方面被滥用的潜在风险进行了专门评估;评估结果表明风险水平较低。
随着行业开发出更强大的模型,共同制定与风险相称的安全措施将至关重要。随着时间的推移,Google将继续学习并完善针对开放模型的安全实践。
ShieldGemma 2 为图像应用提供内置安全保障
在推出 Gemma 3 的同时,Google还发布了 ShieldGemma 2,这是一款基于 Gemma 3 构建的强大的 40 亿参数图像安全检查器。ShieldGemma 2 为图像安全提供了现成的解决方案,可针对危险内容、色情内容和暴力内容这三个安全类别输出安全标签。开发人员可以根据自身的安全需求和用户情况进一步定制 ShieldGemma 2。ShieldGemma 2 是开源的,旨在提供灵活性和可控性,它利用 Gemma 3 架构的性能和效率来推动负责任的人工智能开发。
易于集成
Gemma 3 和 ShieldGemma 2 可以无缝集成到您现有的工作流程中:
- 使用您喜爱的工具进行开发:Gemma 3 支持 Hugging Face Transformers、Ollama、JAX、Keras、PyTorch、Google AI Edge、UnSloth、vLLM 和 Gemma.cpp 等工具,您可以灵活地为项目选择最佳工具。
- 秒级开始实验:即时访问 Gemma 3 并立即开始构建。在 Google AI Studio 中探索其全部潜力,或者通过 Kaggle 或 Hugging Face 下载模型。
- 根据您的特定需求定制 Gemma 3:Gemma 3 附带了经过改进的代码库,其中包括用于高效微调与推理的方法。使用您首选的平台(如 Google Colab、Vertex AI,甚至是您的游戏 GPU)对模型进行训练和调整。
- 按您的方式进行部署:Gemma 3 提供多种部署选项,包括 Vertex AI、Cloud Run、Google GenAI API、本地环境和其他平台,让您能够灵活地为您的应用程序和基础设施选择最合适的方式。
- 在 NVIDIA GPU 上体验优化的性能:NVIDIA 已对 Gemma 3 模型进行了直接优化,以确保您在从 Jetson Nano 到最新的 Blackwell 芯片等各种尺寸的 GPU 上都能获得最佳性能。Gemma 3 现已列入 NVIDIA API 目录中,只需通过 API 调用即可实现快速原型制作。
- 在多个硬件平台上加速您的人工智能开发:Gemma 3 还针对 Google Cloud TPU 进行了优化,并通过开源的 ROCm™堆栈与 AMD GPU 集成。对于 CPU 执行,Gemma.cpp 提供了直接的解决方案。
生态丰富
Gemmaverse 是一个由社区创建的庞大的 Gemma 模型和工具生态系统,随时可为您的创新提供动力并激发灵感。例如,新加坡人工智能公司(AI Singapore)的 SEA-LION v3 打破了语言障碍,促进了整个东南亚地区的交流;INSAIT 的 BgGPT 是一款开创性的以保加利亚语为主的大型语言模型,展示了 Gemma 在支持多种语言方面的强大能力;Nexa AI 的 OmniAudio 展示了设备端人工智能的潜力,为日常设备带来了先进的音频处理能力。
为了进一步推动学术研究取得突破,Google推出了 Gemma 3 学术项目。学术研究人员可以申请 Google Cloud 代金券(每次奖励价值 10000 美元),以加速他们基于 Gemma 3 的研究。申请表从今天开始开放,将持续开放四周。请在Google的网站上申请。
开始使用
作为Google持续致力于让更多人能够使用高质量人工智能的一部分,Gemma 3 代表了Google的下一步行动。准备好探索 Gemma 3 了吗?您可以从以下方面入手:
1. 即时探索:
- 无需设置,直接在浏览器中通过 Google AI Studio 以全精度试用 Gemma 3。
- 直接从 Google AI Studio 获取 API 密钥,并将 Gemma 3 与 Google GenAI SDK 一起使用。
定制与构建:
- 从 Hugging Face、Ollama 或 Kaggle 下载 Gemma 3 模型。
- 使用 Hugging Face 的 Transformers 库或您首选的开发环境,轻松对模型进行微调并使其适应您的独特需求。
部署与扩展:
- 使用 Vertex AI 将您定制的 Gemma 3 成果大规模推向市场。
- 使用 Ollama 在 Cloud Run 上进行推理。
- 从 NVIDIA API 目录中开始使用 NVIDIA NIMs。