k8s 拉取镜像时,请求提前断开(EOF)导致拉取失败

这次问题发生在使用 Keycloak 官方 quickstart YAML 部署资源时:

复制代码
kubectl create -f https://raw.githubusercontent.com/keycloak/keycloakquickstarts/refs/heads/main/kubernetes/keycloak.yaml

创建出来的资源包括:

复制代码
service/keycloak
service/keycloak-discovery
statefulset.apps/keycloak
deployment.apps/postgres
service/postgres

但是 Postgres Pod 一直无法启动,事件中反复出现镜像拉取失败:

复制代码
Failed to pull image "mirror.gcr.io/postgres:17":failed to pull and unpack image "mirror.gcr.io/postgres:17":failed to copy:failed to do request:Get "https://mirror.gcr.io/v2/postgres/..." EOF

这里的关键错误是:

复制代码
EOF

它表示 containerd 在拉取镜像时,请求还没正常完成,连接就被提前断开了。最开始怀疑是 k3s 节点没有配置代理,或者 containerd 没有走代理。

随后检查了 k3s 的配置目录:

复制代码
sudo ls -l /etc/rancher/k3s/

结果只有:

复制代码
config.yamlk3s.yaml

没有:

复制代码
registries.yaml

说明当前 k3s 没有通过 /etc/rancher/k3s/registries.yaml 配置镜像仓库 mirror。

然后继续检查 k3s 的 systemd 环境变量:

复制代码
sudo systemctl show k3s --property=Environment

发现 k3s 已经配置了代理:

复制代码
HTTP_PROXY=http://127.0.0.1:7897HTTPS_PROXY=http://127.0.0.1:7897NO_PROXY=...

为了确认代理本身是否可用,又分别用普通用户和 root 用户测试:

复制代码
curl -I -x http://127.0.0.1:7897 https://mirror.gcr.iosudo curl -I -x http://127.0.0.1:7897 https://mirror.gcr.io

返回中出现:

复制代码
HTTP/1.1 200 Connection established

说明代理连接本身是通的。后面的 HTTP/2 405 只是因为 mirror.gcr.io 根路径不接受这种 HEAD 请求,并不代表代理失败。

最后直接用 k3s 的 crictl 测试两个镜像源:

复制代码
sudo k3s crictl pull mirror.gcr.io/postgres:17

结果失败:

复制代码
EOF

再测试 Docker Hub 原始镜像:

复制代码
sudo k3s crictl pull docker.io/library/postgres:17

结果成功:

复制代码
Image is up to date for sha256:...

这一步最终定位出问题原因:
k3s 的代理链路是可用的,postgres:17 镜像本身也可以正常拉取,真正的问题是 mirror.gcr.io/postgres:17 这个镜像源在当前网络环境下不稳定。

最终解决方式是不要继续使用:

复制代码
image: mirror.gcr.io/postgres:17

而是改成:

复制代码
image: docker.io/library/postgres:17

如果资源已经创建,可以直接修改 Deployment 镜像:

复制代码
kubectl set image deployment/postgres postgres=docker.io/library/postgres:17 -n keycloak

然后查看 rollout 状态:

复制代码
kubectl rollout status deployment/postgres -n keycloak

也可以把远程 YAML 下载到本地后替换镜像地址:

复制代码
curl -L -o keycloak.yaml https://raw.githubusercontent.com/keycloak/keycloak-quickstarts/refs/heads/main/kubernetes/keycloak.yamlsed -i 's#mirror.gcr.io/postgres:17#docker.io/library/postgres:17#g' keycloak.yamlkubectl apply -n keycloak -f keycloak.yaml

总结来说,这次排查链路是:
Pod 拉取镜像失败 → 发现错误为 mirror.gcr.io/postgres:17 EOF → 检查 k3s 是否配置 registry mirror → 检查 k3s 是否配置 HTTP 代理 → 验证代理端口可用 → 使用 crictl pull 分别测试 mirror.gcr.iodocker.io → 确认 Docker Hub 原始镜像可拉、mirror.gcr.io 不可拉 → 将 YAML 中的镜像源从 mirror.gcr.io/postgres:17 改为 docker.io/library/postgres:17,问题解决。

相关推荐
2501_912784082 小时前
告别“汗水出海”:基于微服务架构的跨境电商系统设计与实现——以Taocarts为例
微服务·云原生·架构·taocarts
牛奶咖啡132 小时前
k8s容器编排技术实践——k8s的介绍及其整体运行架构
云原生·kubernetes·k8s是什么?有啥用?·k8s的应用场景·k8s的优缺点边界·k8s的重要概念·k8s的整体运行架构
码农阿豪2 小时前
Docker 部署 XiuXianGame 文字修仙游戏:极空间 NAS 上随时挂机刷资源
游戏·docker·容器
狼与自由2 小时前
微服务的演化过程
微服务·云原生·架构
小坏讲微服务3 小时前
小白搭建K8S集群0基础教程实战
docker·云原生·容器·kubernetes
xingfujie4 小时前
Ubuntu K8s 1.28 kubeadm 高可用集群部署实战
linux·运维·服务器·docker·kubernetes
AI视觉网奇4 小时前
docker vllm 开机启动
docker·容器·vllm
9命怪猫4 小时前
[K8S小白问题集] - K8S为什么选择etcd而不是别的key-value DB?比如Redis
云原生·容器·kubernetes
小夏子_riotous5 小时前
Kubernetes学习路径——3. Kubernetes 1.25 高可用集群部署实战:从 Docker 到 Calico 全链路详解
linux·运维·学习·docker·容器·kubernetes·centos