Gemma 4 介绍
Google DeepMind 推出了 Gemma 4 系列开源模型,这是迄今为止谷歌最智能的开源模型家族,基于 Gemini 3 的相同世界级研究和技术构建。Gemma 4 主打"单位参数智能水平"(intelligence-per-parameter)极致优化,首次引入混合专家(MoE)架构,全面支持从手机/边缘设备到工作站的本地部署。
官方中文页面:ai.google.dev/gemma/docs/...
1. 模型规格(四种尺寸)
- E2B(Effective 2B) :超轻量,针对超移动、边缘设备、浏览器、手机(如 Pixel、Raspberry Pi)。
- E4B(Effective 4B) :移动设备优化,近零延迟。
- 26B A4B(MoE 混合专家) :总参数 260 亿,推理时仅激活约 38 亿参数,低延迟、高效率。
- 31B Dense(稠密模型) :最高性能,非量化 bfloat16 可适配单张 80GB H100 GPU,量化后支持消费级 GPU。
边缘模型(E2B/E4B)上下文窗口 128K tokens ;较大模型 256K tokens。
2. 核心功能亮点(相比前代 Gemma 3 的重大升级)
- 多模态输入 :全系列原生支持文本 + 图片 (可变宽高比/分辨率,支持 OCR、图表理解、视频);E2B 和 E4B 额外原生支持音频输入。
- 高级推理能力 :内置可配置"思考模式"(Chain-of-Thought),支持
thinking=True开启内部逻辑推演;显著提升数学、复杂逻辑、多步规划能力。 - Agentic(智能体)工作流 :原生函数调用(Function Calling) 、结构化 JSON 输出、原生系统提示(System Role)支持,可直接串接 API、工具,构建自主代理。
- 语言与编码 :原生支持 140+ 语言;编码、指令遵循能力大幅提升,适合本地编程助手、IDE 集成。
- 效率优化:26B MoE 模型推理极快;整体适合本地运行,无需云端 API 成本。
3. 性能表现
- 31B 模型在行业标准 Arena AI 文本排行榜 上位列全球开源模型第 3。
- 26B 模型位列第 6。
- 单位参数智能水平极高,甚至超越参数量大 20 倍的模型,适合本地/边缘部署。
4. 许可与可用性
- 许可协议 :全面切换为Apache 2.0(极度宽松的商业许可),开发者可自由商用、微调、集成,无此前自定义许可的限制。
- 获取方式:立即可用
-
- Google AI Studio / Gemini API
- Hugging Face、Kaggle、Ollama 下载权重
- Android AICore Developer Preview、Google AI Edge Gallery
- 支持预训练 + 指令调优版本。
手机端Gemma 4
Google AI Edge Gallery 是谷歌官方推出的 手机端 AI 工具箱 ,能让你直接在 Android /iPhone 上 离线运行 Gemma 4 等大模型(完全本地、不上云)。

下面给你 Google Play 下载 → 安装 → 下载 Gemma 4 → 完整使用 全流程(手机一步到位)。
一、安装(Google Play 路线)
1. 下载安装
-
打开 Google Play 商店
-
搜索:Google AI Edge Gallery(开发者:Google LLC)
-
点 安装 → 等待完成
-
打开应用
-
授权:
- 存储权限 → 允许(必须)
- 相机 / 麦克风(可选,用于图片 / 语音)
2. 系统要求
- Android 12+ / iOS 16+
- 内存 ≥ 6GB(推荐 8GB+)
- 存储空间 ≥ 3GB(Gemma 4-E2B ≈2.5GB,E4B≈3.6GB)
二、下载 Gemma 4 模型(手机内直接下)
打开后首页就是 模型列表,推荐:
- Gemma 4-E2B-it(轻量,2B 级,6GB 手机流畅)
- Gemma 4-E4B-it(全能,4B 级,8GB + 首选)
步骤:
-
点模型右侧 Download
- 建议 Wi‑Fi 下载
-
等待下载 → 自动解压(1--3 分钟)
-
完成后按钮变成 Open
三、核心功能(Gemma 4 全支持)
1. AI Chat(聊天 + 思考模式)
- 多轮对话、写作、代码、翻译、问答
- Thinking Mode (Gemma 4 专属):显示模型思考过程(推理步骤)
- 参数:Temperature、Top-P、Max tokens
2. Ask Image(多模态看图)
- 上传图片 → 问问题:描述、OCR、图表解读、解题
- 支持 JPG/PNG/WebP,最大 4096×4096
3. Audio Scribe(离线语音转文字)
- 录音 / 上传音频 → 转文本 / 翻译
- 完全本地、不上云
4. Prompt Lab(提示词实验室)
- 预设模板:摘要、改写、代码、翻译
- 批量测试、对比不同模型
5. Agent Skills(工具调用,Gemma 4 新功能)
- 内置:维基百科搜索、地图、总结卡片
- 让 AI 联网查资料、生成可视化(仍本地运行)
6. 性能面板
- 实时显示:TTFT(首 token 延迟)、生成速度、内存占用