Google重磅发布Gemma 4：Apache 2.0许可证带来的开源“权力转移“

引言

2026年4月2日，Google DeepMind发布了Gemma 4。这不仅是又一代开源模型的发布，而且是Google首次在自己主导的Gemma系列上，将开源许可证从自定义使用条款切换为Apache 2.0------一份没有商业限制、没有数据传染风险、不可单方面撤销的行业标准协议。这个"switches（切换）"，在技术社区引发的震动，远超模型发布本身。

而Gemma 4本身的能力，同样值得关注。Google官方称之为"迄今为止每参数智能最高的开放模型"：31B参数版本在开源模型Arena排名全球第三；26B MoE版本引入了稀疏激活架构，推理成本远低于同规模密集模型；四种规格从手机芯片（E2B/E4B）到服务器单卡H100（26B/31B）实现了全覆盖；原生支持函数调用、结构化JSON输出和超长上下文；视觉与音频多模态能力首次完整下沉到边缘设备；端侧模型与下一代Gemini Nano 4技术同源，今天的原型应用未来可直接迁移至Android原生AI能力。

Gemma 4的发布正如硬币的正反两面：正面是参数效率与架构能力的全面跃升，背面是Google主动放弃了对开源模型的单方面控制权。这不是技术决策，这是战略表态。

一、"受控开放"到真正的开源

1.Gemma 4的能力全景

图片

Gemma 4于2026年4月2日发布，并同时宣布切换至Apache 2.0许可证。

先看能力，Gemma 4发布了四个规格的模型，面向完全不同的硬件层级做了精准优化。

26B MoE是整个系列的工程亮点：260亿参数总量，但推理时仅激活38亿，采用稀疏激活架构，在消费级GPU上可本地运行，延迟和吞吐量均远优于同等参数量的密集模型，上下文窗口达到256K。

31B Dense是质量优先选项，310亿参数密集架构，在开源模型Arena排名全球第三，仅次于参数量更大的GLM-5和Kimi 2.5，是微调任务的强大基础，在单张H100 GPU上即可运行。

E2B和E4B是边缘端双档，分别以有效20亿和40亿参数覆盖手机、Raspberry Pi和Jetson Nano等场景，追求极致能效和完全离线运行能力；E4B还额外支持原生音频输入，用于语音识别任务。

更重要的是，这四个规格的模型全部支持高级推理与智能体工作流原生特性------函数调用、结构化JSON输出、原生系统指令，以及超过140种语言的多语言支持。视觉方面，所有模型都能原生处理视频和图像，支持可变分辨率，擅长OCR和图表理解等任务。Google官方将这一代Gemma的核心定位描述为"专为高级推理和智能体工作流构建"：它的目标不是做更好的聊天机器人，而是成为能够可靠驱动自主AI Agent的底层引擎。

最值得注意的战略信号，藏在端侧模型里。E2B/E4B端侧模型与未来Gemini Nano 4技术同源，Android开发者现在可以在AICore开发者预览版中使用 Gemma 4原型化智能体流程，并在未来直接迁移至Android原生AI能力。这意味着今天开发者基于E2B构建的应用，不仅能跑在手机和开发板上，更将成为Google移动AI生态的入场券------Google在端侧AI的布局，远比单次模型发布更有战略纵深。

2.协议变更，比模型发布更重要

在开源软件的世界里，许可证从来不只是法律文本，它是一份权力宣言------每一条款背后，都是发布者对"谁有权做什么"的精确计算。

Google的Gemma系列，从诞生起就走了一条微妙的路。2024年Gemma 1.0发布时，Google使用的是一份自定义使用条款（Gemma Terms of Use）。相比Meta的Llama自定义许可证，Gemma的条款更为宽松，但仍然保留了两项关键权力，让企业在实际使用时不得不三思。

第一项是单方面远程限制权。Google在条款中明确保留了"以远程或其他方式，限制其认为违反禁用政策的Gemma使用"的权利。这意味着：哪怕你已经商业化部署了一整套Gemma产品线，Google依然可以随时要求你停用，无需经过法院，也无需给出完整理由。第二项更隐蔽------可称之为"数据传染条款"。Gemma条款将"Model Derivatives"定义为"基于Gemma生成的合成数据所创建的任何机器学习模型"。这意味着：任何开发者用Gemma辅助生成的合成数据微调了一个模型，这个新模型也自动成为"受 Gemma 协议约束的衍生作品"，下游开发者若使用这些数据，同样受到Google条款的间接约束。Hugging Face社区曾专门就此发起讨论帖，引发了广泛担忧。

TechCrunch在2025年3月的深度报道中，将这种风险命名为"rug-pull"风险------企业最担心的，不是当下的法律不确定性，而是"未来某一天，基于Gemma构建的成熟产品，突然被Google要求缴械"。在一个企业级产品生命周期通常需要五年以上的行业里，这种"保留改口权利"的条款，足以让大量有规模的商业部署决策者在法务阶段止步。

3.新协议：不再是可收回的借条

协议切换，才是这代Gemma最具历史意义的变更。Apache 2.0的核心特点，用一句话概括：永久授权、永久自由。它不可撤销，不存在Google可以单方面修改的退出条款；允许自由用于商业产品，无需付费，无需申请；不禁止军事、医疗、金融等高风险使用场景；用Gemma生成的合成数据所训练的模型，不受Gemma协议约束，没有"数据传染"风险；此外还明确授予所有用户相关专利的使用权。

换句话说：Gemma 4的代码权重，现在真正属于整个社区。Google放弃了对模型衍生使用的控制权，换来的是生态入场券。

二、开源协议战：谁是真开源

要理解Gemma 4这一步的战略分量，必须把它放回大模型时代开源协议演化的坐标系里。

两种哲学，一条暗线

开源运动史上，协议的演化始终是权力博弈的晴雨表。1991年Linux诞生，Linus Torvalds选择了GPL------这是一份"左版权"协议，要求任何基于GPL代码的衍生作品也必须开源，制造了一个"病毒效应"：开源代码一旦进入GPL体系，就永远留在体系里。到了2000年代，Apache 2.0和MIT许可证崛起，成为"右版权"阵营的代表------允许自由使用、修改、商业化，甚至可以把衍生代码闭源。它们的哲学截然不同：开放是选择，不是义务。GPL说社区的利益不可分割，Apache/MIT说你的创新由你做主。两种路线，本质上代表两种权力观。

Llama"受控开放"与Gemma的矛盾

2023年，大模型闯入开源世界。但没有人会天真地以为各家是在"共建社区"。

Meta的Llama------"开源"最响亮的声音------实际上使用的是自定义社区许可证。开源促进会（OSI）在2025年2月的一份报告中明确指出，Llama许可证不符合开源定义。原因在于几处精心设计的限制：Llama禁止"改进其他任何大语言模型"（Llama除外），实质上是保护Meta不被自己开源的模型反噬；超过7亿月活跃用户必须申请特殊商业许可------《财富》杂志2023年7月的报道揭示了这条门槛的精准射程：Snapchat约7.5亿月活、TikTok约8.34亿月活、微信2016年起已突破7亿，这些直接竞争对手均被覆盖。无论是否有意设计，结果都是一个：任何有潜力做大的竞争者，都必须在成功后向Meta申请额外的"通行证"。此外，Llama 2还存在一个从未被解释的欧盟用户排除条款。

Llama的"开源"，是一种精心设计的"受控开放"。Meta开放了模型权重，但它保留了对自己生态系统的控制权。任何基于Llama构建的繁荣，都必须以Meta为圆心。

相比Llama，Google的Gemma系列更微妙。Llama的限制写在明面上，开发者看得见，可以主动规避；Gemma的风险藏在字里行间，反而成了埋在地下、随时可能炸响的法律地雷。两代"开源"模型，两种"开放"姿态------但都不是真正的开源。

Google为什么此时打出这张牌？

这不是Google的"慷慨"，这是竞争压力下的理性选择。

第一层压力来自国产模型的崛起。阿里Qwen系列从2024年起持续迭代，Qwen3.6-Plus在编程任务评测中已与闭源顶级模型正面交锋。但更根本的威胁在于开发者生态本身。据新华社旗下光明网援引Hugging Face数据：截至2025年10月，Qwen系列累计下载量已超越Meta的Llama，成为全球下载量最高的开源模型；到2026年1月，Qwen全球累计下载量正式突破7亿次，2025年12月单月下载量更是超过了紧随其后的Llama、DeepSeek、OpenAI、Mistral、NVIDIA、智谱GLM、月之暗面、MiniMax这八大热门开源模型的下载量总和。阿里累计开源近400个Qwen系列模型，催生了超过18万个衍生改进版本。当"全球第一开源模型"的标签悄然易主，Google必须用更低的门槛来争夺开发者。

第二层压力来自企业客户。在医疗、金融、法律等高监管行业，采购AI模型的决策链必经法务。一份自定义许可证的不确定性，远大于Apache 2.0的已知边界------这是理性的法务决策者不会忽视的差异。

第三层压力来自硬件生态。Gemma 4 的 E2B/E4B端侧模型明确与Google Pixel、高通、联发科合作优化。如果Google在芯片层合作的同时继续保留"随时改条款"的权利，手机厂商的法务团队第一个站出来反对。

一句话：协议越开放，生态越容易扩张。Google放弃的是控制权，换来的是生态入场券。

三、博弈背后的真实权力结构

1.开源AI的三种玩家

回顾当前开源AI格局，可以清晰地看到三种截然不同的协议策略。第一种是受控开放，以Llama为代表。Meta开放了模型权重，但保留了对生态的控制权，目标是"通过开源建立事实标准，锁定下游开发者"，代价是企业客户信任度低，法律风险不透明。第二种是战术让步，以Gemma为代表。Google从自定义条款转向行业标准协议，核心动机是在开源模型竞争白热化时重新赢得开发者信任，代价是放弃了对模型衍生使用的控制权。第三种是全面开放，以DeepSeek和Mistral为代表。它们从一开始就采用MIT或Apache 2.0，目标是以最大开放换取开发者社区的信任，以速度换生态，代价是无法从模型本身直接变现，必须通过云服务或企业支持来维持商业运转。

三种路线没有对错之分。但有一点是确定的：开源协议的开放程度，与开发者的信任度成正比，与商业控制的程度成反比。在大模型时代，这三者之间的平衡点，就是各家战略能力的分水岭。

2."开放洗白"：被稀释的概念

值得警惕的是：Gemma 4的Apache 2.0切换，不等于Google在AI领域变得"无私"。训练数据不透明是第一道裂缝。Gemma 4 的权重开放了，但 Google 从未公布训练数据的来源和构成，这与真正的"开放"------开放权重、开放训练代码、开放数据集------仍有本质差距。Gemini云服务捆绑是第二道裂缝。Google的商业重心始终在Gemini的云端 API服务上，开源Gemma是引流工具，闭源Gemini才是利润来源。商标保护则是第三道。Apache 2.0允许自由使用代码，但Google保留了"Gemma"商标的使用权------任何商业产品如果想使用Gemma的名字进行营销，仍需授权。

开源协议只是权力博弈的一个维度，而非全部。开放了权重，不等于开放了全部；选择了Apache 2.0，不等于放弃了一切商业利益。一个成熟的观察者，需要同时看到开源姿态背后的战略意图，以及仍然存在的商业壁垒。

3.对中国大模型生态的传导

Gemma 4的协议切换，将对国内开源生态产生不可忽视的传导压力。

首先是开发者流失风险。如果Gemma 4在Apache 2.0下真正实现"无限制商业使用"，那些此前因法律不确定性而选择Qwen或GLM的开发者，可能会出现回流，尤其在跨境业务场景中。其次是标准竞争加速。Apache 2.0的普及，实际上是在帮助Google建立一个新的"开源AI标准"------谁不开源到这个程度，谁就在开发者眼中显得保守，国内厂商将面临更大的协议开放压力。

但与此同时，也存在差异化竞争的机会窗口。国产模型的核心优势不在于协议，而在于中文语境的理解、特定行业垂直数据的深度，以及更低的推理延迟。如果Qwen和GLM能在这个窗口期进一步提升开放程度------真正开源训练代码和数据集，将有机会在国际开源社区建立与中国制造对应的"开源可信"形象。Gemma 4撕开了一道口子，谁来接住这道口子，决定了国产开源模型下一阶段的国际站位。

结语

Gemma 4不是Google的"觉醒"，而是一张必须打出的竞争牌。

开源协议从来不是技术问题，而是一套精心设计的权力语法：开放什么、保留什么、约束什么，每一行条款背后都是利益计算。Google从Gemma Terms切换到Apache 2.0，意味着它选择了更大的开放半径，更小的控制半径。这是竞争使然，不是道德进步。

但这恰恰是它值得被记录的原因：在一个利益驱动的行业里，每一次更大规模的开放，无论动机如何，都在客观上拓宽了开发者可以自由探索的边界。Llama的7亿门槛、Gemma的rug-pull风险、Qwen的7亿次下载------这些数字背后，不只是技术竞争，更是关于"谁有权定义开放"的持续博弈。

真正值得观察的，是接下来会发生什么：Meta会跟吗？Llama 4，会选择真正的开源吗？而中国的开源大模型们，又会在这个新的坐标系里，找到怎样的位置？

这些问题的答案，决定了开源AI的下一个十年。