💡 128k上下文+140种语言!Gemma 3如何改写设备端AI规则?

Gemma 3 是由 Google DeepMind 推出的一系列轻量级、先进的开放模型,旨在在设备上运行。它在性能、多语言支持、文本和视觉推理能力、上下文窗口、函数调用以及量化版本等方面具有显著优势。同时,还推出了 ShieldGemma 2 用于图像安全检查。Gemma 3 可与多种工具集成,拥有庞大的生态系统,并且推出了学术项目。它代表了在普及高质量人工智能方面的新进展。

Gemma 3 的新功能:

1. 世界上最优秀的单加速器模型

Gemma 3 在其模型规模下展现出了领先的性能水平,在 LMArena 排行榜的初步人类偏好评估中,超越了 Llama-405B、DeepSeek-V3 和 o3-mini 等模型。这有助于你创建引人入胜的用户体验,并且这些应用可以在单个 GPU 或 TPU 主机上运行。

2. 支持 140 种语言,走向全球

开发能使用客户母语的应用程序。Gemma 3 提供了对超过 35 种语言的开箱即用支持,以及对超过 140 种语言的预训练支持。

3. 创建具有先进文本和视觉推理能力的人工智能

轻松开发能够分析图像、文本和短视频的应用程序,为交互式和智能应用开辟新的可能性。

4. 通过扩展的上下文窗口处理复杂任务

Gemma 3 提供了 128k 标记的上下文窗口,使你的应用程序能够处理和理解大量信息。

5. 使用函数调用创建由人工智能驱动的工作流程

Gemma 3 支持函数调用和结构化输出,帮助你实现任务自动化并构建智能代理体验。

6. 通过量化模型实现更快的高性能

Gemma 3 推出了官方量化版本,在保持高精度的同时,减小了模型大小并降低了计算要求。

此图表根据 Chatbot Arena 的埃洛(Elo)分数对人工智能模型进行排名;分数越高(数字越靠前)表明用户的偏好程度越高。圆点表示估计所需的英伟达 H100 GPU 数量。Gemma 3 270 亿参数模型排名很高,尽管其他一些模型需要多达 32 块 GPU,但它仅需单块 GPU 即可运行。

Gemma 3 的严格安全协议

Google 认为,开放模型需要进行仔细的风险评估,而Google的方法在创新与安全之间取得平衡 ------ 根据模型的能力来调整测试的强度。Gemma 3 的开发过程包括广泛的数据治理,通过微调使其与Google的安全政策保持一致,以及进行全面的基准评估。虽然对能力更强的模型进行全面测试通常有助于Google评估能力较弱的模型,但 Gemma 3 在科学、技术、工程和数学(STEM)方面增强的性能促使Google针对其在制造有害物质方面被滥用的潜在风险进行了专门评估;评估结果表明风险水平较低。

随着行业开发出更强大的模型,共同制定与风险相称的安全措施将至关重要。随着时间的推移,Google将继续学习并完善针对开放模型的安全实践。

ShieldGemma 2 为图像应用提供内置安全保障

在推出 Gemma 3 的同时,Google还发布了 ShieldGemma 2,这是一款基于 Gemma 3 构建的强大的 40 亿参数图像安全检查器。ShieldGemma 2 为图像安全提供了现成的解决方案,可针对危险内容、色情内容和暴力内容这三个安全类别输出安全标签。开发人员可以根据自身的安全需求和用户情况进一步定制 ShieldGemma 2。ShieldGemma 2 是开源的,旨在提供灵活性和可控性,它利用 Gemma 3 架构的性能和效率来推动负责任的人工智能开发。

易于集成

Gemma 3 和 ShieldGemma 2 可以无缝集成到您现有的工作流程中:

  1. 使用您喜爱的工具进行开发:Gemma 3 支持 Hugging Face Transformers、Ollama、JAX、Keras、PyTorch、Google AI Edge、UnSloth、vLLM 和 Gemma.cpp 等工具,您可以灵活地为项目选择最佳工具。
  2. 秒级开始实验:即时访问 Gemma 3 并立即开始构建。在 Google AI Studio 中探索其全部潜力,或者通过 Kaggle 或 Hugging Face 下载模型。
  3. 根据您的特定需求定制 Gemma 3:Gemma 3 附带了经过改进的代码库,其中包括用于高效微调与推理的方法。使用您首选的平台(如 Google Colab、Vertex AI,甚至是您的游戏 GPU)对模型进行训练和调整。
  4. 按您的方式进行部署:Gemma 3 提供多种部署选项,包括 Vertex AI、Cloud Run、Google GenAI API、本地环境和其他平台,让您能够灵活地为您的应用程序和基础设施选择最合适的方式。
  5. 在 NVIDIA GPU 上体验优化的性能:NVIDIA 已对 Gemma 3 模型进行了直接优化,以确保您在从 Jetson Nano 到最新的 Blackwell 芯片等各种尺寸的 GPU 上都能获得最佳性能。Gemma 3 现已列入 NVIDIA API 目录中,只需通过 API 调用即可实现快速原型制作。
  6. 在多个硬件平台上加速您的人工智能开发:Gemma 3 还针对 Google Cloud TPU 进行了优化,并通过开源的 ROCm™堆栈与 AMD GPU 集成。对于 CPU 执行,Gemma.cpp 提供了直接的解决方案。

生态丰富

Gemmaverse 是一个由社区创建的庞大的 Gemma 模型和工具生态系统,随时可为您的创新提供动力并激发灵感。例如,新加坡人工智能公司(AI Singapore)的 SEA-LION v3 打破了语言障碍,促进了整个东南亚地区的交流;INSAIT 的 BgGPT 是一款开创性的以保加利亚语为主的大型语言模型,展示了 Gemma 在支持多种语言方面的强大能力;Nexa AI 的 OmniAudio 展示了设备端人工智能的潜力,为日常设备带来了先进的音频处理能力。

为了进一步推动学术研究取得突破,Google推出了 Gemma 3 学术项目。学术研究人员可以申请 Google Cloud 代金券(每次奖励价值 10000 美元),以加速他们基于 Gemma 3 的研究。申请表从今天开始开放,将持续开放四周。请在Google的网站上申请。

开始使用

作为Google持续致力于让更多人能够使用高质量人工智能的一部分,Gemma 3 代表了Google的下一步行动。准备好探索 Gemma 3 了吗?您可以从以下方面入手:

1. 即时探索:

  • 无需设置,直接在浏览器中通过 Google AI Studio 以全精度试用 Gemma 3。
  • 直接从 Google AI Studio 获取 API 密钥,并将 Gemma 3 与 Google GenAI SDK 一起使用。

定制与构建:

  • 从 Hugging Face、Ollama 或 Kaggle 下载 Gemma 3 模型。
  • 使用 Hugging Face 的 Transformers 库或您首选的开发环境,轻松对模型进行微调并使其适应您的独特需求。

部署与扩展:

  • 使用 Vertex AI 将您定制的 Gemma 3 成果大规模推向市场。
  • 使用 Ollama 在 Cloud Run 上进行推理。
  • 从 NVIDIA API 目录中开始使用 NVIDIA NIMs。
相关推荐
阳光明媚大男孩23 分钟前
PyTorch分布式训练
人工智能·pytorch·分布式
AustinCyy37 分钟前
【论文笔记】Best Practices and Lessons Learned on Synthetic Data for Language Models
论文阅读·人工智能·语言模型
若兰幽竹1 小时前
【数据挖掘】通过心脏病数据案例熟悉数据挖掘的完整过程
人工智能·数据挖掘
月落星还在1 小时前
AI学习——图像分类技术深度解析:从传统方法到深度学习的演进
人工智能·分类
若兰幽竹1 小时前
【机器学习】主成分分析法(PCA)
人工智能·机器学习·信息可视化
巫山老妖2 小时前
我的智能写作&知识库管理搭子--ima.copilot
人工智能
俄城杜小帅2 小时前
opencv+ONNX模型的推理
人工智能·opencv·计算机视觉
shengjk12 小时前
只会写代码的程序员,注定没有出路!
人工智能·后端
shengjk12 小时前
Flink 中RocksDB 为什么将每个键和值的限制为 2^31 字节
人工智能·后端
ZhuBin3652 小时前
概率论与数理统计
人工智能·深度学习·机器学习·自动化·概率论