💡 128k上下文+140种语言!Gemma 3如何改写设备端AI规则?

Gemma 3 是由 Google DeepMind 推出的一系列轻量级、先进的开放模型,旨在在设备上运行。它在性能、多语言支持、文本和视觉推理能力、上下文窗口、函数调用以及量化版本等方面具有显著优势。同时,还推出了 ShieldGemma 2 用于图像安全检查。Gemma 3 可与多种工具集成,拥有庞大的生态系统,并且推出了学术项目。它代表了在普及高质量人工智能方面的新进展。

Gemma 3 的新功能:

1. 世界上最优秀的单加速器模型

Gemma 3 在其模型规模下展现出了领先的性能水平,在 LMArena 排行榜的初步人类偏好评估中,超越了 Llama-405B、DeepSeek-V3 和 o3-mini 等模型。这有助于你创建引人入胜的用户体验,并且这些应用可以在单个 GPU 或 TPU 主机上运行。

2. 支持 140 种语言,走向全球

开发能使用客户母语的应用程序。Gemma 3 提供了对超过 35 种语言的开箱即用支持,以及对超过 140 种语言的预训练支持。

3. 创建具有先进文本和视觉推理能力的人工智能

轻松开发能够分析图像、文本和短视频的应用程序,为交互式和智能应用开辟新的可能性。

4. 通过扩展的上下文窗口处理复杂任务

Gemma 3 提供了 128k 标记的上下文窗口,使你的应用程序能够处理和理解大量信息。

5. 使用函数调用创建由人工智能驱动的工作流程

Gemma 3 支持函数调用和结构化输出,帮助你实现任务自动化并构建智能代理体验。

6. 通过量化模型实现更快的高性能

Gemma 3 推出了官方量化版本,在保持高精度的同时,减小了模型大小并降低了计算要求。

此图表根据 Chatbot Arena 的埃洛(Elo)分数对人工智能模型进行排名;分数越高(数字越靠前)表明用户的偏好程度越高。圆点表示估计所需的英伟达 H100 GPU 数量。Gemma 3 270 亿参数模型排名很高,尽管其他一些模型需要多达 32 块 GPU,但它仅需单块 GPU 即可运行。

Gemma 3 的严格安全协议

Google 认为,开放模型需要进行仔细的风险评估,而Google的方法在创新与安全之间取得平衡 ------ 根据模型的能力来调整测试的强度。Gemma 3 的开发过程包括广泛的数据治理,通过微调使其与Google的安全政策保持一致,以及进行全面的基准评估。虽然对能力更强的模型进行全面测试通常有助于Google评估能力较弱的模型,但 Gemma 3 在科学、技术、工程和数学(STEM)方面增强的性能促使Google针对其在制造有害物质方面被滥用的潜在风险进行了专门评估;评估结果表明风险水平较低。

随着行业开发出更强大的模型,共同制定与风险相称的安全措施将至关重要。随着时间的推移,Google将继续学习并完善针对开放模型的安全实践。

ShieldGemma 2 为图像应用提供内置安全保障

在推出 Gemma 3 的同时,Google还发布了 ShieldGemma 2,这是一款基于 Gemma 3 构建的强大的 40 亿参数图像安全检查器。ShieldGemma 2 为图像安全提供了现成的解决方案,可针对危险内容、色情内容和暴力内容这三个安全类别输出安全标签。开发人员可以根据自身的安全需求和用户情况进一步定制 ShieldGemma 2。ShieldGemma 2 是开源的,旨在提供灵活性和可控性,它利用 Gemma 3 架构的性能和效率来推动负责任的人工智能开发。

易于集成

Gemma 3 和 ShieldGemma 2 可以无缝集成到您现有的工作流程中:

  1. 使用您喜爱的工具进行开发:Gemma 3 支持 Hugging Face Transformers、Ollama、JAX、Keras、PyTorch、Google AI Edge、UnSloth、vLLM 和 Gemma.cpp 等工具,您可以灵活地为项目选择最佳工具。
  2. 秒级开始实验:即时访问 Gemma 3 并立即开始构建。在 Google AI Studio 中探索其全部潜力,或者通过 Kaggle 或 Hugging Face 下载模型。
  3. 根据您的特定需求定制 Gemma 3:Gemma 3 附带了经过改进的代码库,其中包括用于高效微调与推理的方法。使用您首选的平台(如 Google Colab、Vertex AI,甚至是您的游戏 GPU)对模型进行训练和调整。
  4. 按您的方式进行部署:Gemma 3 提供多种部署选项,包括 Vertex AI、Cloud Run、Google GenAI API、本地环境和其他平台,让您能够灵活地为您的应用程序和基础设施选择最合适的方式。
  5. 在 NVIDIA GPU 上体验优化的性能:NVIDIA 已对 Gemma 3 模型进行了直接优化,以确保您在从 Jetson Nano 到最新的 Blackwell 芯片等各种尺寸的 GPU 上都能获得最佳性能。Gemma 3 现已列入 NVIDIA API 目录中,只需通过 API 调用即可实现快速原型制作。
  6. 在多个硬件平台上加速您的人工智能开发:Gemma 3 还针对 Google Cloud TPU 进行了优化,并通过开源的 ROCm™堆栈与 AMD GPU 集成。对于 CPU 执行,Gemma.cpp 提供了直接的解决方案。

生态丰富

Gemmaverse 是一个由社区创建的庞大的 Gemma 模型和工具生态系统,随时可为您的创新提供动力并激发灵感。例如,新加坡人工智能公司(AI Singapore)的 SEA-LION v3 打破了语言障碍,促进了整个东南亚地区的交流;INSAIT 的 BgGPT 是一款开创性的以保加利亚语为主的大型语言模型,展示了 Gemma 在支持多种语言方面的强大能力;Nexa AI 的 OmniAudio 展示了设备端人工智能的潜力,为日常设备带来了先进的音频处理能力。

为了进一步推动学术研究取得突破,Google推出了 Gemma 3 学术项目。学术研究人员可以申请 Google Cloud 代金券(每次奖励价值 10000 美元),以加速他们基于 Gemma 3 的研究。申请表从今天开始开放,将持续开放四周。请在Google的网站上申请。

开始使用

作为Google持续致力于让更多人能够使用高质量人工智能的一部分,Gemma 3 代表了Google的下一步行动。准备好探索 Gemma 3 了吗?您可以从以下方面入手:

1. 即时探索:

  • 无需设置,直接在浏览器中通过 Google AI Studio 以全精度试用 Gemma 3。
  • 直接从 Google AI Studio 获取 API 密钥,并将 Gemma 3 与 Google GenAI SDK 一起使用。

定制与构建:

  • 从 Hugging Face、Ollama 或 Kaggle 下载 Gemma 3 模型。
  • 使用 Hugging Face 的 Transformers 库或您首选的开发环境,轻松对模型进行微调并使其适应您的独特需求。

部署与扩展:

  • 使用 Vertex AI 将您定制的 Gemma 3 成果大规模推向市场。
  • 使用 Ollama 在 Cloud Run 上进行推理。
  • 从 NVIDIA API 目录中开始使用 NVIDIA NIMs。
相关推荐
Work(沉淀版)29 分钟前
DAY 40
人工智能·深度学习·机器学习
蓦然回首却已人去楼空1 小时前
Build a Large Language Model (From Scratch) 序章
人工智能·语言模型·自然语言处理
CM莫问1 小时前
<论文>(微软)WINA:用于加速大语言模型推理的权重感知神经元激活
人工智能·算法·语言模型·自然语言处理·大模型·推理加速
拾忆-eleven2 小时前
NLP学习路线图(二十六):自注意力机制
人工智能·深度学习
MYH5162 小时前
在NLP文本处理中,将字符映射到阿拉伯数字(构建词汇表vocab)的核心目的和意义
人工智能·深度学习·自然语言处理
要努力啊啊啊3 小时前
KV Cache:大语言模型推理加速的核心机制详解
人工智能·语言模型·自然语言处理
mzlogin5 小时前
DIY|Mac 搭建 ESP-IDF 开发环境及编译小智 AI
人工智能
归去_来兮5 小时前
知识图谱技术概述
大数据·人工智能·知识图谱
就是有点傻5 小时前
VM图像处理之图像二值化
图像处理·人工智能·计算机视觉
行云流水剑5 小时前
【学习记录】深入解析 AI 交互中的五大核心概念:Prompt、Agent、MCP、Function Calling 与 Tools
人工智能·学习·交互