谷歌 Gemma：一个轻量级开源模型

在过去的一周，世界见证了两家科技巨头最具突破性的人工智能进步。OpenAI 推出了令人惊叹的 AI 视频生成器 Sora，而 Google 推出了 Gemini 1.5 模型，能够支持多达 100 万个 Token 上下文。

Gemma，是一个轻量级、最先进的开源模型系列，它建立在用于创建 Gemini 模型的研究和技术的基础上。

Gemma 是以拉丁语 gemma 命名，意思是宝石，Gemma 从其前身 Gemini 中汲取灵感，反映了它在科技界的价值和稀有性。

它们是文本到文本、仅限解码器的大型语言模型，提供英语版本，具有开放权重、预训练变体和指令调整变体。

Gemma 已经开始在全球范围内提供两种大小 2B 和 7B，支持多种工具和系统，并可以在开发人员笔记本电脑和工作站上运行。

Gemma 模型有 20 billion 和 70 billion 参数大小可供选择。 2B 模型旨在移动设备和笔记本电脑上运行，而 7B 模型旨在台式计算机和小型服务器上运行。

Gemma 也有两个版本：调整版和预训练版。

由于 Gemma 体积小，因此能够直接在用户的笔记本电脑上运行。下图显示了 Gemma（7B）的语言理解和生成性能与 LLaMA 2 （7B）、LLaMA 2（13B）和 Mistral（7B）等类似大小的开放模型的比较。

可以在此处查看每个基准的更详细比较。

Gemini 1.5 提供了重大增强功能，旨在解决初始版本的缺点：

1,000,000 个Token上下文：这是目前任何大型基础模型中最大的上下文。 OpenAI 的 GPT-4 具有 128K 上下文。
将有更快的响应：谷歌正在采用可能为 GPT-4 提供支持的专家混合 MoE 架构，使得模型能够将提示分解为子任务并将其路由给专门的"专家"，从而显着提高效率和性能。
快速信息检索：新模型展示了在大量文本、视频或音频数据中精确定位特定细节的能力显着提高。
更擅长编码：大型上下文可以对整个代码库进行深入分析，帮助 Gemini 模型掌握复杂的关系、模式和对代码的理解。