【技术底稿 10】16G Ubuntu 服务器手动部署 Ollama 0.20.4 全流程（避坑 HTTP2 错误）

安装包：ollama-linux-amd64.tar.zst采用离线包部署，避开官方 curl 脚本下载慢、HTTP2 framing error 等网络问题。

bash

运行

复制代码

sudo apt update && sudo apt install zstd -y

bash

运行

复制代码

# 解压 zst 为 tar
zstd -d ollama-linux-amd64.tar.zst

# 解压 tar 包
tar -xf ollama-linux-amd64.tar

bash

运行

复制代码

sudo mv bin/ollama /usr/local/bin/
sudo chmod +x /usr/local/bin/ollama

bash

运行

复制代码

ollama --version

图 1：ollama --version 版本验证成功截图，显示客户端版本 0.20.4 即为安装完成。

bash

运行

复制代码

ollama serve

图 2：ollama serve 启动成功界面，出现 Listening on 127.0.0.1:11434 代表服务正常运行。

bash

运行

复制代码

ollama pull nomic-embed-text

图 3：nomic-embed-text 向量模型下载中，受网络环境影响，下载速度较慢，可通过配置国内镜像、手动离线导入等方式优化。

bash

运行

复制代码

ollama list

本次使用二进制手动部署，相比 Docker 更轻量、相比官方脚本更稳定，16GB 内存服务器可稳定运行向量模型与轻量大模型，作为后续 AI 知识库、RAG 系统的底层推理环境

下一步部署 Milvus 向量数据库，打通 Ollama + Milvus 本地 RAG 知识库完整链路。

关注我

持续更新《人生底稿》成长史 &《技术底稿》&《产品底稿》实战干货一起踏实成长，不焦虑、不内卷。

📚 系列导航：