Mac 本地部署 Ollama 并运行 Gemma 4 模型

一、什么是 Ollama

Ollama 是一个本地运行大语言模型的工具,支持 macOS / Linux / Windows。它把模型下载、运行、API 服务全部封装好,一条命令就能跑起来。

二、安装 Ollama

方式一:官网下载(推荐)

  1. 打开 ollama.com/download
  2. 点击 Download for macOS
  3. 下载后解压,将 Ollama.app 拖入「应用程序」文件夹
  4. 双击打开,菜单栏会出现 Ollama 图标,表示服务已启动

方式二:Homebrew 安装

bash 复制代码
brew install ollama

安装完成后启动服务:

bash 复制代码
ollama serve

验证安装

bash 复制代码
ollama --version

看到版本号即安装成功。

三、下载并运行 Gemma 4 模型

一条命令下载并运行

bash 复制代码
ollama run gemma4

首次运行会自动下载模型(约 5GB),下载完成后直接进入对话。之后再运行则跳过下载,直接启动。

输入问题即可聊天,输入 /bye 退出。

查看已下载的模型

bash 复制代码
ollama list

四、Ollama 常用命令

命令 说明
ollama serve 启动 Ollama 服务(桌面版自动启动)
ollama pull <模型名> 下载模型
ollama run <模型名> 运行模型并进入对话
ollama list 查看已下载的模型列表
ollama rm <模型名> 删除模型
ollama show <模型名> 查看模型详细信息
ollama ps 查看当前运行中的模型

五、通过 API 调用

Ollama 启动后会在 localhost:11434 提供 HTTP API。

健康检查

bash 复制代码
curl http://localhost:11434

返回 Ollama is running 表示正常。

非流式对话

bash 复制代码
curl -X POST http://localhost:11434/api/chat \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gemma4",
    "messages": [{"role": "user", "content": "你好"}],
    "stream": false
  }'

流式对话

bash 复制代码
curl -X POST http://localhost:11434/api/chat \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gemma4",
    "messages": [{"role": "user", "content": "介绍一下你自己"}],
    "stream": true
  }'

查看可用模型

bash 复制代码
curl http://localhost:11434/api/tags

六、运行状态

模型非常吃内存,目前一开始回复就会将我的mac内存吃满,我的是16g的macmini

相关推荐
To_OC20 小时前
别再跟 AI 死磕 prompt 了,我写了个 Loop 让它自己改到满意为止
人工智能·aigc·agent
悟空码字20 小时前
【高德开放平台skill】从拍脑袋到看数据,我是如何把一个“选址直觉“做成 AI Skill 的
aigc·openai·ai编程
Gatlin21 小时前
当你告诉AI“帮我搞定这件事”——AI Agent正在改变规则
aigc
怕浪猫1 天前
第一章:AI Agent概览:开启智能体时代
aigc·agent·ai编程
leeyi1 天前
Multi-Agent:让多个 AI 分工协作完成复杂任务
后端·aigc·agent
Alson_Code1 天前
人机协作项目文档--HITL-AgentScope
后端·aigc·ai编程
leeyi2 天前
Prompt 模板:用变量组装发给 AI 的消息
aigc·agent·ai编程
用户5191495848452 天前
libcurl Headers API 释放后重利用漏洞:跨请求复用头句柄导致堆内存安全风险
人工智能·aigc
用户5191495848452 天前
CVE-2025-1094 PostgreSQL SQL注入与WebSocket劫持远程代码执行利用工具
人工智能·aigc