K8s集群初始化遇到的问题

kubectl describe pod coredns-545d6fc579-s9g5s -n kube-system

找到原因1:CoreDNS Pod 处于 Pending 状态的原因是集群中的节点都带有 node.kubernetes.io/not-ready 污点

journalctl -u kubelet -f

14:57:59.178592 3553 remote_image.go:114] "PullImage from image service failed" err="rpc error: code = Unknown desc = error pulling image configuration: download failed after attempts=6: dial tcp 4.78.139.50:443: connect: connection refused" image="docker.io/calico/cni:v3.25.0"

找到原因2:Kubelet 在尝试从 docker.io 拉取 Calico 的 CNI 镜像时失败,连接被拒绝

查看calico.yaml中所需要的镜像,发现都是从docker hub中拉取的,目前由于政策原因,只能更换加速器

bash 复制代码
[root@k8s-master ~]# grep image calico.yaml | sort | uniq 
          image: docker.io/calico/cni:v3.25.0
          image: docker.io/calico/kube-controllers:v3.25.0
          image: docker.io/calico/node:v3.25.0
          imagePullPolicy: IfNotPresent

解决操作1:添加加速器

bash 复制代码
cat /etc/docker/daemon.json 
{
"registry-mirrors": ["https://b9pmyelo.mirror.aliyuncs.com","https://dockerpull.com","https://docker.aityp.com/"],
"exec-opts": ["native.cgroupdriver=systemd"]
}

之后重新拉取calico镜像

kubectl delete -f calico.yaml

kubectl apply -f calico.yaml

kubectl get pods -n kube-system

calico-node-dzq28 0/1 Init:0/3 0 5m40s

calico-node-vsnwj 0/1 Init:0/3 0 5m40s

**找到原因3:**可以看出有两个clico节点pod尚未初始化成功

kubectl describe pod calico-node-dzq28 -n kube-system

找到原因4: 根据 kubectl describe 的输出,显示 kubelet 一直在尝试拉取 docker.io/calico/cni:v3.25.0 镜像,但没有成功完成拉取。这通常意味着节点无法从 Docker 仓库拉取镜像。

**解决操作2:**前面只更换了master节点中docker的操作,故节点还是无法拉取镜像,只需给节点添加相应镜像

添加后,重启docker,在重新执行操作1,所有pod都是runnning

相关推荐
云游牧者1 小时前
K8S故障排查三板斧-CSDN博客
运维·docker·云原生·kubernetes·k8s·容器化·故障排查
Geoking.2 小时前
云计算服务模型详解:SaaS、PaaS 与 IaaS 的区别、发展历史与应用场景
云原生·云计算·paas
AIDF20263 小时前
K8s 完整知识体系(含架构图)
云原生·容器·kubernetes
霜落花轻扬3 小时前
docker 开发环境卡死的解决办法
运维·docker·容器
@王先生13 小时前
docker安装固定版本20.10 k8s 1.23.17兼容版本
docker·容器·kubernetes
眷蓝天4 小时前
Kubernetes RBAC 认证机制
云原生·容器·kubernetes
humcomm4 小时前
云原生技术的未来发展趋势是什么(2026年4月)
云原生