Ollama 指南

从安装到运行的 Ollama 快速指南,适合本地学习和日常测试使用

一、Ollama 是什么(一句话)

Ollama 是一个用于在本地运行大语言模型(如 LLaMA、Qwen、Mistral 等)的工具,支持 一行命令拉模型、直接对话运行,非常适合本地实验和开发测试。

二、安装 Ollama

1️⃣ Windows / macOS / Linux

👉 官方下载地址:

https://ollama.com/download

下载安装后,终端执行:

ollama --version

能正常输出版本号,说明安装成功。

三、启动 Ollama 服务

✅ macOS / Linux

安装完成后会自动启动后台服务,无需手动启动。

✅ Windows

安装后同样会自动启动,如需手动启动:

ollama serve

四、运行第一个模型(推荐)

1️⃣ 拉取并运行模型(一次完成)

ollama run llama3

或(中文效果更好):

ollama run qwen2.5

第一次运行会自动下载模型(几 GB),请耐心等待。

五、常用命令速查

查看已下载模型

ollama list

运行指定模型

ollama run mistral

删除模型

ollama rm llama3

查看运行中的模型

ollama ps

六、通过 API 使用 Ollama(进阶)

Ollama 默认在本地启动一个服务:

http://localhost:11434

示例:使用 curl 调用

curl http://localhost:11434/api/generate -d '{

"model": "qwen2.5",

"prompt": "介绍一下 Ollama 的作用"

}'

七、常见问题

❓ 模型下载慢

建议使用稳定网络

可提前下载常用模型,避免频繁拉取

❓ 显存 / 内存不够

选择参数更小的模型(如 7b、8b)

同一时间只运行一个模型

❓ 中文效果不好

推荐模型:

qwen2.5

llama3:8b

deepseek-r1

八、典型学习路径(结合你前面的目标)

建议顺序:

本地成功运行 ollama run qwen2.5

理解模型下载、启动、停止流程

使用 API 调用

再结合 Docker / 容器环境进行测试

相关推荐
妙妙屋(zy)14 小时前
Claude Code+CC-Switch+CC-Connect+飞书使用教程
ai
Java研究者16 小时前
AI智能体研发 | 什么是OpenAI API协议
人工智能·大模型·openai·api·agent·智能体
小七-七牛开发者16 小时前
Coding Agent 规则管理:CLAUDE.md、Skills、Hooks、Subagents 到底怎么选?
ai·大模型·agent·claude·token·loop·mcp·claudecode·ai coding
doiito1 天前
左脚踩右脚:让 LLM 自进化的 Agent 轨迹训练法——为什么它能补上主流范式的最后一块拼图
ai·系统设计
带刺的坐椅1 天前
从 Claude Code 隐私争议,看 SolonCode 的设计选择
ai·llm·agent·claudecode·soloncode·codingplan
lincats2 天前
Claude Code项目越写越乱?这套清理流程能救你
ai·ai agent·claude code
云燕实验室CloudLab2 天前
《AI开始"抱团"思考了!多智能体 + 思维图到底有多强?》
ai·学习工具·智慧学伴
小七-七牛开发者2 天前
论文解读:DeepSeek DSpark 在真实高并发推理服务中,如何保证 Token 生成又好又快?
ai·大模型·编程·ai coding
doiito2 天前
【Agent Harness】Gliding Horse 核心设计理念,不跟风开发自己的AI Agent
ai·rust·架构设计·系统设计·ai agent
doiito3 天前
【Agent Harness】Gliding Horse 的 L2 作战地图:让多 Agent 协作从“摸黑”变成“透明”
ai·rust·架构设计·系统设计·ai agent