OpenClaw + Ollama + Gemma 4 本地部署
适用设备 :Mac mini M4 / MacBook
核心特点:完全离线、免费、私有化部署、无需API密钥
一、核心特性速览
| 特性 | 说明 |
|---|---|
| 完全离线 | 断网或不联网状态下可正常使用 |
| 无需API | 不需要申请或配置任何云端API密钥 |
| 数据安全 | 所有公司文件、机密数据均保存在本地电脑 |
| 零费用 | 全程免费使用,无任何调用成本 |
唯一需要联网的场景:首次下载模型权重、首次安装Ollama/依赖库、更新模型或软件时。
二、三者关系图解
将这套系统比作一辆汽车,三者分工明确:
- Gemma 4 = 发动机(负责思考、推理的核心大脑)
- Ollama = 发动机支架 + 接口面板(负责启动、管理模型,并提供统一的调用接口)
- OpenClaw = 整车(提供用户界面、方向盘、仪表盘等操控系统)
调用逻辑:OpenClaw 不直接与 Gemma 4 交互,而是与 Ollama 通信;Ollama 再将请求转发给 Gemma 4。
三、部署步骤(三步完成)
- 安装 Ollama :访问 https://ollama.com 下载并安装。
- 下载并运行 Gemma 4 :在Mac终端中执行命令
ollama run gemma4。看到模型成功启动并可以聊天,即表示本地模型已就绪。 - 配置 OpenClaw :在OpenClaw的设置中,按以下内容填写4项配置:
- 模型类型 :
ollama - 接口地址 :
http://127.0.0.1:11434 - 模型名称 :
gemma4 - API Key:(留空,因为本地不需要)
- 模型类型 :
技术一句话说明 :本地用Ollama运行Gemma 4,OpenClaw对接本地地址http://127.0.0.1:11434,模型名为gemma4,即可实现纯离线调用,不联网、不用API。
四、本地知识库方案 (RAG)
方案A:手动粘贴(适合少量文档)
- 操作:在OpenClaw对话框中直接粘贴文档全文,然后提问(例如:"帮我总结这个文档的关键点")。
- 优点:最简单、最安全、零配置。
- 缺点:每次都需要手动粘贴。
方案B:真正的本地知识库(推荐)
所需工具(全免费、本地运行):Ollama、Gemma 4、OpenClaw、本地向量库(如Chroma/LanceDB)。
工作流程:
- 指定一个本地文件夹(如:
/Users/用户名/文档/)。 - 系统扫描文档 → 转换为文本 → 存入本地向量库。
- 提问时:OpenClaw → 查询本地向量库 → 将结果发给Gemma 4 → 生成答案返回。
安全保证:
- ✅ 文件不会离开你的Mac
- ✅ 不会上传到任何服务器
- ✅ 全程离线,不联网
- ✅ 只能读取你指定的目录
- ✅ 其他文件、系统文件完全碰不到
给技术的配置话术(复制即用):
"我要做本地RAG知识库,要求:1. 只读取我指定的本地文件夹,不扫描其他位置;2. 向量库存在本地,不上云;3. 全程离线,不联网;4. 调用本地Ollama的gemma4模型;5. 接口对接OpenClaw;6. 确保公司机密文件绝对不出本地电脑。"
五、本地智能体 (Agent) 方案
当前结构认知:
- Gemma 4(大脑):负责思考、判断、决策。
- 缺少的部分:工具调用、记忆、计划、执行、工作流等执行层框架。
推荐方案 :直接使用 OpenClaw 作为智能体的外壳。它能理解意图、调用本地工具、执行工作流,且完全不联网。
进阶方案:
- Open Interpreter:适用于个人/小团队,轻量级代码方案。
- LangChain / AutoGen :专业级,支持工具调用、多轮记忆、任务拆解、RAG。配置示例:
llm: ollama://gemma4
六、关键认知:本地模型的定位
场景选择指南
- 需要对外查实时信息:使用云端API(如豆包、Kimi、DeepSeek等)。
- 对内处理公司数据、工作流、私有化部署:使用本地模型(如Gemma 4)。
本地模型的能力边界
- ✅ 擅长:推理、逻辑、写作、代码、总结;处理企业内部文档、流程、话术。
- ❌ 不擅长/无法做到:知道"今天发生的实时新闻"(其知识截止于训练时);无法实时联网查资料。
核心权衡 :离线 = 安全、可控、免费,但没有实时信息。
总结
你现在这套方案(Mac + 本地Gemma 4 + 本地OpenClaw )就是一个标准的完全离线本地AI方案:
✅ 本地部署
✅ 免费
✅ 不走外网
✅ 不泄露公司数据
✅ OpenClaw 用本地 Gemma 4 当大脑
100% 能通,放心用。