Google开源DiffusionGemma:26B MoE扩散语言模型,放弃自回归实现4倍推理加速2026年6月11日,Google正式发布实验性开源模型DiffusionGemma,以Apache 2.0许可证开放。这是一款基于文本扩散(Text Diffusion)机制构建的大语言模型,采用26B参数的MoE(Mixture of Experts,混合专家)架构,推理时仅激活约3.8B参数。与传统自回归(Autoregressive)大语言模型逐token顺序生成的方式不同,DiffusionGemma通过并行去噪的方式输出文本,每次前向传播可并行生成256个token。在单张NVIDIA H10