【技术底稿 10】16G Ubuntu 服务器手动部署 Ollama 0.20.4 全流程(避坑 HTTP2 错误)

一、环境说明

  • 系统:Ubuntu 22.04 LTS
  • 内存:16GB
  • 安装方式:手动二进制部署(非官方脚本、非 Docker)
  • 适用场景:本地大模型推理、RAG 向量知识库、个人 DevOps 平台底层环境

二、前置准备

安装包:ollama-linux-amd64.tar.zst采用离线包部署,避开官方 curl 脚本下载慢、HTTP2 framing error 等网络问题。

三、安装步骤

1. 安装 zst 解压工具

bash

运行

复制代码
sudo apt update && sudo apt install zstd -y

2. 解压安装包

bash

运行

复制代码
# 解压 zst 为 tar
zstd -d ollama-linux-amd64.tar.zst

# 解压 tar 包
tar -xf ollama-linux-amd64.tar

3. 移动到系统目录并赋权

bash

运行

复制代码
sudo mv bin/ollama /usr/local/bin/
sudo chmod +x /usr/local/bin/ollama

4. 验证安装版本

bash

运行

复制代码
ollama --version

图 1:ollama --version 版本验证成功截图,显示客户端版本 0.20.4 即为安装完成。

5. 启动 Ollama 服务

bash

运行

复制代码
ollama serve

图 2:ollama serve 启动成功界面,出现 Listening on 127.0.0.1:11434 代表服务正常运行。

6. 拉取向量模型(RAG 专用)

bash

运行

复制代码
ollama pull nomic-embed-text

图 3:nomic-embed-text 向量模型下载中,受网络环境影响,下载速度较慢,可通过配置国内镜像、手动离线导入等方式优化。

7. 查看已安装模型

bash

运行

复制代码
ollama list

四、常见问题

  1. 官方脚本下载失败使用二进制离线包,彻底规避 HTTP2 网络错误、连接超时。

  2. 模型下载速度慢可配置国内镜像加速,或多次断点续传。

  3. 服务后台常驻

    bash

    运行

    复制代码
    nohup ollama serve &

五、实战说明

本次使用二进制手动部署,相比 Docker 更轻量、相比官方脚本更稳定,16GB 内存服务器可稳定运行向量模型与轻量大模型,作为后续 AI 知识库、RAG 系统的底层推理环境

六、后续规划

下一步部署 Milvus 向量数据库,打通 Ollama + Milvus 本地 RAG 知识库完整链路。


关注我

持续更新《人生底稿》成长史 &《技术底稿》&《产品底稿》实战干货一起踏实成长,不焦虑、不内卷。

📚 系列导航:

【人生底稿 01】|农村少年(1995--2005)

【技术底稿】01:37岁老码农,用4台机器搭了套个人DevOps平台

【产品底稿01】37 岁 Java 老码农,用 Java 搭了个 AI 写作助手,把自己 14 年技术文章全喂给了 AI!

相关推荐
ZFSS9 分钟前
VS Code + Hailuo MCP 使用指南
人工智能·ai·copilot·ai编程·ai写作
AndrewHZ10 分钟前
【LLM技术全景】开源大模型生态:如何选择适合你的基座模型?
人工智能·深度学习·语言模型·开源·llm·transformer·基座模型
AI导出鸭PC端11 分钟前
ChatGPT怎么生成word文档?「AI 导出鸭」解决格式丢失痛点
人工智能·ai·chatgpt·word·豆包·ai导出鸭
装不满的克莱因瓶13 分钟前
自动微分的原理:计算图与前向传播
人工智能·pytorch·python·数学·ai·微积分·计算图
来让爷抱一个15 分钟前
MonkeyCode 与 DevOps 集成:AI 驱动的 CI/CD 流水线优化
ai编程·devops·monkeycode
调试优选官22 分钟前
2026上海AI搜索GEO优化:技术路径与服务能力全景梳理
人工智能·ai·geo·上海
俊哥V41 分钟前
每日 AI 研究简报 · 2026-06-11
人工智能·ai
Rain50942 分钟前
1.1 理解AI Agent与自动化数据分析
人工智能·ai·数据分析·自动化·ai编程
A15362551 小时前
六轴工业机械臂厂家怎么选?评估维度与选型参考
大数据·服务器·人工智能
放下华子我只抽RuiKe51 小时前
FastAPI 全栈后端(六):中间件与依赖注入
ai·中间件·fastapi·ai编程·qwen·ai大模型·openclaw