【技术底稿 23】Ollama + Docker + Ubuntu 部署踩坑实录:网络通了,参数还在调

下午5点到晚上10点半,5个半小时。代码一行没改,全是环境、配置、默认参数的坑。

网络隔离、防火墙、Ollama默认监听127.0.0.1、Linux vs Windows差异------每一个都踩了一遍。

目前网络已通,向量模型的上下文问题还在调。


前置条件

  • 操作系统:Ubuntu 桌面版

  • Ollama版本:v0.20.4

  • Docker环境:本地容器化部署

  • 显卡:NVIDIA MX150(当前纯CPU运行)

  • 核心模型:nomic-embed-text(上下文上限2048)


一、前言

今天从下午5点折腾到晚上10点半,看似是业务代码报错,实则是一场被网络隔离、防火墙、Ollama默认参数、跨系统差异联手"背刺"的连环事故。

所有问题的共性是:代码本身无任何Bug,全是环境、中间件默认配置、系统兼容性的隐性坑。

这篇把今天踩的坑按排查顺序完整复盘,以后遇到类似问题直接对照定位,再也不用靠玄学试错。


二、网络 & Docker容器类坑(已解决)

2.1 Docker容器网络隔离坑

现象:宿主机本地、Windows客户端访问服务完全正常,Docker容器内部访问宿主机端口/服务直接超时。

根因 :Docker容器使用独立的虚拟网络,与宿主机网络天然隔离,不能直接通过localhost访问宿主机服务。

结论 :排查容器内服务调用,优先确认是否用对了宿主机真实IP ,而非localhost

2.2 防火墙端口放行坑

现象 :外部网络、宿主机本地都能正常连接,唯独Docker容器访问直接报Connect timed out

根因 :Ubuntu ufw防火墙默认拦截外部/跨网段端口请求,即使服务本身监听了0.0.0.0,没放行端口也会被拦截。

解决

bash

复制代码
ufw allow 11434

2.3 Ollama跨网络访问坑

现象:宿主机本地调用Ollama正常,Docker容器/其他机器调用11434端口直接连接失败。

根因 :Ollama默认仅监听127.0.0.1,仅允许宿主机本地访问。

解决

bash

复制代码
OLLAMA_HOST=0.0.0.0 ollama serve

三、Ollama部署坑

3.1 监听地址坑(已解决)

bash

复制代码
OLLAMA_HOST=0.0.0.0 ollama serve

3.2 上下文上限坑(正在排查中)

现象:同一份代码、同一份分片文本,Windows上Ollama运行正常,Linux上直接阻塞、报500错误或1分钟超时。

错误日志

text

复制代码
{"error":"the input length exceeds the context length"}

根因

  • 向量模型nomic-embed-text原生上下文上限为2048

  • Ollama Linux版默认num_ctx参数过高,模型不兼容直接阻塞

  • Windows版有自动容错截断,Linux版校验严格

当前状态 :正在调整分块大小和num_ctx参数,尝试手动对齐模型上限:

bash

复制代码
OLLAMA_CONTEXT_LENGTH=2048 ollama serve

后续排查方向:确认LangChain4j调用时是否正确传递了num_ctx参数。


四、业务代码 & 分片逻辑坑

4.1 分片本身无问题

排查后确认:语义分片、标题/元数据/正文拆分逻辑完全合规,文本长度可控,排除业务代码与分片规则问题

4.2 多业务耦合干扰坑

爬虫流程强耦合"图片FTP上传",FTP端口未放行导致连锁报错,严重干扰排查方向。

优化方向:核心业务链路与非核心附件上传流程解耦,隔离异常影响范围。


五、硬件 & 系统环境坑

Linux vs Windows Ollama核心差异

对比项 Windows Ollama Linux Ollama
参数校验 自动兼容、弱校验、容错截断 严格强校验、无自动容错
网络监听 相对宽松 仅本地回环,跨网段默认封禁
上下文处理 超长文本自动截断 严格匹配模型上限,超限直接阻塞

核心结论 :Linux环境下不能照搬Windows用法,隐性参数必须手动约束配置

纯CPU推理性能坑

轻量向量模型在批量计算场景下,CPU资源消耗极高,低压笔记本CPU无法长时间承载,极易引发超时、服务假死。(当前显卡驱动未装,纯CPU运行)


六、核心结论

序号 结论
1 Linux下Ollama不能照搬Windows习惯,num_ctx、监听地址等参数必须手动约束
2 NVIDIA独显设备跑AI服务,驱动是刚需,当前未装,纯CPU性能不足
3 Docker + 跨服务调用出现超时,排查顺序固定:防火墙端口 → 监听地址 → 容器网络 → 中间件配置

七、最后

今天折腾5个半小时,没有一行业务代码需要修改,全是环境和配置的隐性坑。

网络已通,向量模型的上下文问题还在调。这也提醒我们:工程化能力,不仅是写代码,更是在复杂环境中定位和解决问题的能力。


📚 系列导航:

【人生底稿 01】|农村少年(1995--2005)

【技术底稿】01:37岁老码农,用4台机器搭了套个人DevOps平台

【产品底稿01】37 岁 Java 老码农,用 Java 搭了个 AI 写作助手,把自己 14 年技术文章全喂给了 AI!

相关推荐
小夏子_riotous2 小时前
Docker学习路径——8、Dockerfile
linux·运维·docker·容器·系统架构·centos·运维开发
格鸰爱童话2 小时前
python使用milvus向量库
python·milvus
:1212 小时前
java数组2
java·算法·排序算法
2601_955256472 小时前
服务器日志管理最佳实践:logrotate配置详解、云日志服务对比与Docker日志限制方案
运维·服务器·docker
切糕师学AI2 小时前
Docker Compose 完全指南:从入门到实践
运维·docker·容器
酉鬼女又兒2 小时前
JavaLeetCode 第一题「两数之和」:从暴力枚举到一遍哈希表的正确与错误实现,详解HashMap核心知识点及常见陷阱
java·开发语言·数据结构·算法·leetcode·职场和发展·散列表
JackSparrow4142 小时前
彻底理解Java NIO(一)C语言实现 单进程+多进程+多线程 阻塞式I/O 服务器详解
java·linux·c语言·网络·后端·tcp/ip·nio
小江的记录本2 小时前
【微服务与云原生架构】Serverless架构、FaaS/BaaS、核心原理、优缺点
java·后端·微服务·云原生·架构·系统架构·serverless
谢谢 啊sir2 小时前
L2-060 大语言模型的推理 - java
java·人工智能·语言模型