【技术底稿 10】16G Ubuntu 服务器手动部署 Ollama 0.20.4 全流程(避坑 HTTP2 错误)

一、环境说明

  • 系统:Ubuntu 22.04 LTS
  • 内存:16GB
  • 安装方式:手动二进制部署(非官方脚本、非 Docker)
  • 适用场景:本地大模型推理、RAG 向量知识库、个人 DevOps 平台底层环境

二、前置准备

安装包:ollama-linux-amd64.tar.zst采用离线包部署,避开官方 curl 脚本下载慢、HTTP2 framing error 等网络问题。

三、安装步骤

1. 安装 zst 解压工具

bash

运行

复制代码
sudo apt update && sudo apt install zstd -y

2. 解压安装包

bash

运行

复制代码
# 解压 zst 为 tar
zstd -d ollama-linux-amd64.tar.zst

# 解压 tar 包
tar -xf ollama-linux-amd64.tar

3. 移动到系统目录并赋权

bash

运行

复制代码
sudo mv bin/ollama /usr/local/bin/
sudo chmod +x /usr/local/bin/ollama

4. 验证安装版本

bash

运行

复制代码
ollama --version

图 1:ollama --version 版本验证成功截图,显示客户端版本 0.20.4 即为安装完成。

5. 启动 Ollama 服务

bash

运行

复制代码
ollama serve

图 2:ollama serve 启动成功界面,出现 Listening on 127.0.0.1:11434 代表服务正常运行。

6. 拉取向量模型(RAG 专用)

bash

运行

复制代码
ollama pull nomic-embed-text

图 3:nomic-embed-text 向量模型下载中,受网络环境影响,下载速度较慢,可通过配置国内镜像、手动离线导入等方式优化。

7. 查看已安装模型

bash

运行

复制代码
ollama list

四、常见问题

  1. 官方脚本下载失败使用二进制离线包,彻底规避 HTTP2 网络错误、连接超时。

  2. 模型下载速度慢可配置国内镜像加速,或多次断点续传。

  3. 服务后台常驻

    bash

    运行

    复制代码
    nohup ollama serve &

五、实战说明

本次使用二进制手动部署,相比 Docker 更轻量、相比官方脚本更稳定,16GB 内存服务器可稳定运行向量模型与轻量大模型,作为后续 AI 知识库、RAG 系统的底层推理环境

六、后续规划

下一步部署 Milvus 向量数据库,打通 Ollama + Milvus 本地 RAG 知识库完整链路。


关注我

持续更新《人生底稿》成长史 &《技术底稿》&《产品底稿》实战干货一起踏实成长,不焦虑、不内卷。

📚 系列导航:

【人生底稿 01】|农村少年(1995--2005)

【技术底稿】01:37岁老码农,用4台机器搭了套个人DevOps平台

【产品底稿01】37 岁 Java 老码农,用 Java 搭了个 AI 写作助手,把自己 14 年技术文章全喂给了 AI!

相关推荐
垚森6 小时前
AI时代,让曾经的遗憾变成现实
ai
leonshi8 小时前
使用embedchain快速建立rag知识库,本地大模型
ai·rag·ollama
你好潘先生14 小时前
别再记命令了,用 yeero do 说句人话就能跑脚本,而且不烧 token
服务器·python·命令行
doiito15 小时前
【Agent Harness】Gliding Horse 上下文感知与智能压缩:让 Agent 的“注意力”永不偏移
ai·rust·架构设计·系统设计·ai agent
程序员老赵1 天前
服务器文件不想 SFTP 上传?Docker 跑个 File Browser,浏览器就能管理
服务器·docker·开源
vivo互联网技术2 天前
从 10 分钟到 1 秒:ES 深度分页任意跳页的三轮优化实战
服务器·数据库·redis·elasticsearch·深度分页
doiito2 天前
【Agent Harness】Gliding Horse L2 作战地图深度优化:给多 Agent 上下文装上“精准导航”
ai·rust·架构设计·系统设计·ai agent
妙妙屋(zy)2 天前
Claude Code+CC-Switch+CC-Connect+飞书使用教程
ai
小七-七牛开发者2 天前
Coding Agent 规则管理:CLAUDE.md、Skills、Hooks、Subagents 到底怎么选?
ai·大模型·agent·claude·token·loop·mcp·claudecode·ai coding