Google重磅发布Gemma 4:Apache 2.0许可证带来的开源“权力转移“

引言

2026年4月2日,Google DeepMind发布了Gemma 4。这不仅是又一代开源模型的发布,而且是Google首次在自己主导的Gemma系列上,将开源许可证从自定义使用条款切换为Apache 2.0------一份没有商业限制、没有数据传染风险、不可单方面撤销的行业标准协议。这个"switches(切换)",在技术社区引发的震动,远超模型发布本身。

而Gemma 4本身的能力,同样值得关注。Google官方称之为"迄今为止每参数智能最高的开放模型":31B参数版本在开源模型Arena排名全球第三;26B MoE版本引入了稀疏激活架构,推理成本远低于同规模密集模型;四种规格从手机芯片(E2B/E4B)到服务器单卡H100(26B/31B)实现了全覆盖;原生支持函数调用、结构化JSON输出和超长上下文;视觉与音频多模态能力首次完整下沉到边缘设备;端侧模型与下一代Gemini Nano 4技术同源,今天的原型应用未来可直接迁移至Android原生AI能力。

Gemma 4的发布正如硬币的正反两面:正面是参数效率与架构能力的全面跃升,背面是Google主动放弃了对开源模型的单方面控制权。这不是技术决策,这是战略表态。

一、"受控开放"到真正的开源

1.Gemma 4的能力全景

图片

Gemma 4于2026年4月2日发布,并同时宣布切换至Apache 2.0许可证。

先看能力,Gemma 4发布了四个规格的模型,面向完全不同的硬件层级做了精准优化。

26B MoE是整个系列的工程亮点:260亿参数总量,但推理时仅激活38亿,采用稀疏激活架构,在消费级GPU上可本地运行,延迟和吞吐量均远优于同等参数量的密集模型,上下文窗口达到256K。

31B Dense是质量优先选项,310亿参数密集架构,在开源模型Arena排名全球第三,仅次于参数量更大的GLM-5和Kimi 2.5,是微调任务的强大基础,在单张H100 GPU上即可运行。

E2B和E4B是边缘端双档,分别以有效20亿和40亿参数覆盖手机、Raspberry Pi和Jetson Nano等场景,追求极致能效和完全离线运行能力;E4B还额外支持原生音频输入,用于语音识别任务。

更重要的是,这四个规格的模型全部支持高级推理与智能体工作流原生特性------函数调用、结构化JSON输出、原生系统指令,以及超过140种语言的多语言支持。视觉方面,所有模型都能原生处理视频和图像,支持可变分辨率,擅长OCR和图表理解等任务。Google官方将这一代Gemma的核心定位描述为"专为高级推理和智能体工作流构建":它的目标不是做更好的聊天机器人,而是成为能够可靠驱动自主AI Agent的底层引擎。

最值得注意的战略信号,藏在端侧模型里。E2B/E4B端侧模型与未来Gemini Nano 4技术同源,Android开发者现在可以在AICore开发者预览版中使用 Gemma 4原型化智能体流程,并在未来直接迁移至Android原生AI能力。这意味着今天开发者基于E2B构建的应用,不仅能跑在手机和开发板上,更将成为Google移动AI生态的入场券------Google在端侧AI的布局,远比单次模型发布更有战略纵深。

2.协议变更,比模型发布更重要

在开源软件的世界里,许可证从来不只是法律文本,它是一份权力宣言------每一条款背后,都是发布者对"谁有权做什么"的精确计算。

Google的Gemma系列,从诞生起就走了一条微妙的路。2024年Gemma 1.0发布时,Google使用的是一份自定义使用条款(Gemma Terms of Use)。相比Meta的Llama自定义许可证,Gemma的条款更为宽松,但仍然保留了两项关键权力,让企业在实际使用时不得不三思。

第一项是单方面远程限制权。Google在条款中明确保留了"以远程或其他方式,限制其认为违反禁用政策的Gemma使用"的权利。这意味着:哪怕你已经商业化部署了一整套Gemma产品线,Google依然可以随时要求你停用,无需经过法院,也无需给出完整理由。第二项更隐蔽------可称之为"数据传染条款"。Gemma条款将"Model Derivatives"定义为"基于Gemma生成的合成数据所创建的任何机器学习模型"。这意味着:任何开发者用Gemma辅助生成的合成数据微调了一个模型,这个新模型也自动成为"受 Gemma 协议约束的衍生作品",下游开发者若使用这些数据,同样受到Google条款的间接约束。Hugging Face社区曾专门就此发起讨论帖,引发了广泛担忧。

TechCrunch在2025年3月的深度报道中,将这种风险命名为"rug-pull"风险------企业最担心的,不是当下的法律不确定性,而是"未来某一天,基于Gemma构建的成熟产品,突然被Google要求缴械"。在一个企业级产品生命周期通常需要五年以上的行业里,这种"保留改口权利"的条款,足以让大量有规模的商业部署决策者在法务阶段止步。

3.新协议:不再是可收回的借条

协议切换,才是这代Gemma最具历史意义的变更。Apache 2.0的核心特点,用一句话概括:永久授权、永久自由。 它不可撤销,不存在Google可以单方面修改的退出条款;允许自由用于商业产品,无需付费,无需申请;不禁止军事、医疗、金融等高风险使用场景;用Gemma生成的合成数据所训练的模型,不受Gemma协议约束,没有"数据传染"风险;此外还明确授予所有用户相关专利的使用权。

换句话说:Gemma 4的代码权重,现在真正属于整个社区。Google放弃了对模型衍生使用的控制权,换来的是生态入场券。

二、开源协议战:谁是真开源

要理解Gemma 4这一步的战略分量,必须把它放回大模型时代开源协议演化的坐标系里。

两种哲学,一条暗线

开源运动史上,协议的演化始终是权力博弈的晴雨表。1991年Linux诞生,Linus Torvalds选择了GPL------这是一份"左版权"协议,要求任何基于GPL代码的衍生作品也必须开源,制造了一个"病毒效应":开源代码一旦进入GPL体系,就永远留在体系里。到了2000年代,Apache 2.0和MIT许可证崛起,成为"右版权"阵营的代表------允许自由使用、修改、商业化,甚至可以把衍生代码闭源。它们的哲学截然不同:开放是选择,不是义务。GPL说社区的利益不可分割,Apache/MIT说你的创新由你做主。两种路线,本质上代表两种权力观。

Llama"受控开放"与Gemma的矛盾

2023年,大模型闯入开源世界。但没有人会天真地以为各家是在"共建社区"。

Meta的Llama------"开源"最响亮的声音------实际上使用的是自定义社区许可证。开源促进会(OSI)在2025年2月的一份报告中明确指出,Llama许可证不符合开源定义。原因在于几处精心设计的限制:Llama禁止"改进其他任何大语言模型"(Llama除外),实质上是保护Meta不被自己开源的模型反噬;超过7亿月活跃用户必须申请特殊商业许可------《财富》杂志2023年7月的报道揭示了这条门槛的精准射程:Snapchat约7.5亿月活、TikTok约8.34亿月活、微信2016年起已突破7亿,这些直接竞争对手均被覆盖。无论是否有意设计,结果都是一个:任何有潜力做大的竞争者,都必须在成功后向Meta申请额外的"通行证"。此外,Llama 2还存在一个从未被解释的欧盟用户排除条款。

Llama的"开源",是一种精心设计的"受控开放"。Meta开放了模型权重,但它保留了对自己生态系统的控制权。任何基于Llama构建的繁荣,都必须以Meta为圆心。

相比Llama,Google的Gemma系列更微妙。Llama的限制写在明面上,开发者看得见,可以主动规避;Gemma的风险藏在字里行间,反而成了埋在地下、随时可能炸响的法律地雷。两代"开源"模型,两种"开放"姿态------但都不是真正的开源。

Google为什么此时打出这张牌?

这不是Google的"慷慨",这是竞争压力下的理性选择。

第一层压力来自国产模型的崛起。阿里Qwen系列从2024年起持续迭代,Qwen3.6-Plus在编程任务评测中已与闭源顶级模型正面交锋。但更根本的威胁在于开发者生态本身。据新华社旗下光明网援引Hugging Face数据:截至2025年10月,Qwen系列累计下载量已超越Meta的Llama,成为全球下载量最高的开源模型;到2026年1月,Qwen全球累计下载量正式突破7亿次,2025年12月单月下载量更是超过了紧随其后的Llama、DeepSeek、OpenAI、Mistral、NVIDIA、智谱GLM、月之暗面、MiniMax这八大热门开源模型的下载量总和。阿里累计开源近400个Qwen系列模型,催生了超过18万个衍生改进版本。当"全球第一开源模型"的标签悄然易主,Google必须用更低的门槛来争夺开发者。

第二层压力来自企业客户。在医疗、金融、法律等高监管行业,采购AI模型的决策链必经法务。一份自定义许可证的不确定性,远大于Apache 2.0的已知边界------这是理性的法务决策者不会忽视的差异。

第三层压力来自硬件生态。Gemma 4 的 E2B/E4B端侧模型明确与Google Pixel、高通、联发科合作优化。如果Google在芯片层合作的同时继续保留"随时改条款"的权利,手机厂商的法务团队第一个站出来反对。

一句话:协议越开放,生态越容易扩张。Google放弃的是控制权,换来的是生态入场券。

三、博弈背后的真实权力结构

1.开源AI的三种玩家

回顾当前开源AI格局,可以清晰地看到三种截然不同的协议策略。第一种是受控开放,以Llama为代表。Meta开放了模型权重,但保留了对生态的控制权,目标是"通过开源建立事实标准,锁定下游开发者",代价是企业客户信任度低,法律风险不透明。第二种是战术让步,以Gemma为代表。Google从自定义条款转向行业标准协议,核心动机是在开源模型竞争白热化时重新赢得开发者信任,代价是放弃了对模型衍生使用的控制权。第三种是全面开放,以DeepSeek和Mistral为代表。 它们从一开始就采用MIT或Apache 2.0,目标是以最大开放换取开发者社区的信任,以速度换生态,代价是无法从模型本身直接变现,必须通过云服务或企业支持来维持商业运转。

三种路线没有对错之分。但有一点是确定的:开源协议的开放程度,与开发者的信任度成正比,与商业控制的程度成反比。在大模型时代,这三者之间的平衡点,就是各家战略能力的分水岭。

2."开放洗白":被稀释的概念

值得警惕的是:Gemma 4的Apache 2.0切换,不等于Google在AI领域变得"无私"。训练数据不透明是第一道裂缝。Gemma 4 的权重开放了,但 Google 从未公布训练数据的来源和构成,这与真正的"开放"------开放权重、开放训练代码、开放数据集------仍有本质差距。Gemini云服务捆绑是第二道裂缝。Google的商业重心始终在Gemini的云端 API服务上,开源Gemma是引流工具,闭源Gemini才是利润来源。商标保护则是第三道。Apache 2.0允许自由使用代码,但Google保留了"Gemma"商标的使用权------任何商业产品如果想使用Gemma的名字进行营销,仍需授权。

开源协议只是权力博弈的一个维度,而非全部。开放了权重,不等于开放了全部;选择了Apache 2.0,不等于放弃了一切商业利益。一个成熟的观察者,需要同时看到开源姿态背后的战略意图,以及仍然存在的商业壁垒。

3.对中国大模型生态的传导

Gemma 4的协议切换,将对国内开源生态产生不可忽视的传导压力。

首先是开发者流失风险。如果Gemma 4在Apache 2.0下真正实现"无限制商业使用",那些此前因法律不确定性而选择Qwen或GLM的开发者,可能会出现回流,尤其在跨境业务场景中。其次是标准竞争加速。Apache 2.0的普及,实际上是在帮助Google建立一个新的"开源AI标准"------谁不开源到这个程度,谁就在开发者眼中显得保守,国内厂商将面临更大的协议开放压力。

但与此同时,也存在差异化竞争的机会窗口。国产模型的核心优势不在于协议,而在于中文语境的理解、特定行业垂直数据的深度,以及更低的推理延迟。如果Qwen和GLM能在这个窗口期进一步提升开放程度------真正开源训练代码和数据集,将有机会在国际开源社区建立与中国制造对应的"开源可信"形象。Gemma 4撕开了一道口子,谁来接住这道口子,决定了国产开源模型下一阶段的国际站位。

结语

Gemma 4不是Google的"觉醒",而是一张必须打出的竞争牌。

开源协议从来不是技术问题,而是一套精心设计的权力语法:开放什么、保留什么、约束什么,每一行条款背后都是利益计算。Google从Gemma Terms切换到Apache 2.0,意味着它选择了更大的开放半径,更小的控制半径。这是竞争使然,不是道德进步。

但这恰恰是它值得被记录的原因:在一个利益驱动的行业里,每一次更大规模的开放,无论动机如何,都在客观上拓宽了开发者可以自由探索的边界。Llama的7亿门槛、Gemma的rug-pull风险、Qwen的7亿次下载------这些数字背后,不只是技术竞争,更是关于"谁有权定义开放"的持续博弈。

真正值得观察的,是接下来会发生什么:Meta会跟吗?Llama 4,会选择真正的开源吗?而中国的开源大模型们,又会在这个新的坐标系里,找到怎样的位置?

这些问题的答案,决定了开源AI的下一个十年。

相关推荐
l1t3 天前
用llama试用gemma-4-E2B模型量化版本
人工智能·llama·gemma
gutsyang11 天前
Google Stitch:最佳实践
人工智能·google·gemini·stitch
$Qw14 天前
google firebase service account json
android·google
spencer_tseng17 天前
google chrome show virtual keyboard
chrome·google
人道领域18 天前
2026年Q1大模型深度复盘:OpenAI,Gemini2.0,字节跳动,与“多模态Agent”元年
人工智能·ai·google·chatgpt·gemini
用户693717500138418 天前
Room 3.0:这次不是升级,是重来
android·前端·google
码路飞21 天前
Gemini 开放香港了,大陆开发者的 API 能跟着薅吗?实测 3 种方案
google·api·gemini
csdn_aspnet22 天前
如何用 C# 和 Gemma 3 在本地构建一个真正能完成工作的 AI 代理的
人工智能·ai·c#·gemma
Carson带你学Android23 天前
Android 17 重磅发布:详解四大颠覆性变革与保姆级适配指南
google