K8s集群初始化遇到的问题

kubectl describe pod coredns-545d6fc579-s9g5s -n kube-system

找到原因1:CoreDNS Pod 处于 Pending 状态的原因是集群中的节点都带有 node.kubernetes.io/not-ready 污点

journalctl -u kubelet -f

14:57:59.178592 3553 remote_image.go:114] "PullImage from image service failed" err="rpc error: code = Unknown desc = error pulling image configuration: download failed after attempts=6: dial tcp 4.78.139.50:443: connect: connection refused" image="docker.io/calico/cni:v3.25.0"

找到原因2:Kubelet 在尝试从 docker.io 拉取 Calico 的 CNI 镜像时失败,连接被拒绝

查看calico.yaml中所需要的镜像,发现都是从docker hub中拉取的,目前由于政策原因,只能更换加速器

bash 复制代码
[root@k8s-master ~]# grep image calico.yaml | sort | uniq 
          image: docker.io/calico/cni:v3.25.0
          image: docker.io/calico/kube-controllers:v3.25.0
          image: docker.io/calico/node:v3.25.0
          imagePullPolicy: IfNotPresent

解决操作1:添加加速器

bash 复制代码
cat /etc/docker/daemon.json 
{
"registry-mirrors": ["https://b9pmyelo.mirror.aliyuncs.com","https://dockerpull.com","https://docker.aityp.com/"],
"exec-opts": ["native.cgroupdriver=systemd"]
}

之后重新拉取calico镜像

kubectl delete -f calico.yaml

kubectl apply -f calico.yaml

kubectl get pods -n kube-system

calico-node-dzq28 0/1 Init:0/3 0 5m40s

calico-node-vsnwj 0/1 Init:0/3 0 5m40s

**找到原因3:**可以看出有两个clico节点pod尚未初始化成功

kubectl describe pod calico-node-dzq28 -n kube-system

找到原因4: 根据 kubectl describe 的输出,显示 kubelet 一直在尝试拉取 docker.io/calico/cni:v3.25.0 镜像,但没有成功完成拉取。这通常意味着节点无法从 Docker 仓库拉取镜像。

**解决操作2:**前面只更换了master节点中docker的操作,故节点还是无法拉取镜像,只需给节点添加相应镜像

添加后,重启docker,在重新执行操作1,所有pod都是runnning

相关推荐
阿里云云原生1 小时前
AI 开发新常态:当 Cursor、Claude、Codex 并行,如何统一管理散落的 Skill 资产?
云原生·ai编程
探索云原生7 小时前
K8s 1.36 这个 GA 特性,把 initContainer 拉模型的 hack 干掉了
ai·云原生·kubernetes
云恒要逆袭9 小时前
运行你的第一个Docker容器
后端·docker·容器
Java之美9 小时前
从edge-trigger到level-trigger,谈谈 Kubernetes controller 的开发范式
云原生
阿里云云原生1 天前
深度解构:当 Append-only 的 SLS 遇上 Update/Delete,是如何实现设计权衡的?
云原生
Java之美1 天前
一次k8s升级引发的DevicePlugin注册失败
云原生·kubernetes
秋播1 天前
nerdctl推送rancher本地镜像到harbor
云原生
程序员老赵2 天前
10 分钟部署 OpenCode:Docker 一键安装,浏览器打开就能用 AI 写代码(附完整命令与排错)
docker·容器·ai编程
阿里云云原生2 天前
告别冗长链路!Kafka × Table Bucket 实现开放表格式零 ETL 实时入湖
云原生·kafka