解决kubelet报failed to get imageFs info: non-existent label \“docker-images\“

问题:

一环境主机重启后,查看kubelet日志经常有大量无法回收镜像文件报错,会导致kubelet的pleg不健康,从而导致kubelet发生重启。报错如下:

解决办法

解决方法一:

systemctl stop docker

systemctl stop kubelet

systemctl start docker

systemctl start kubelet

解决方法二:

在kubelet的kubelet.service文件中,添加如下参数:

Unit

After=docker.service

原因总结: 主机重启后,kubelet比docker先启动,会对不健康的pod进行一个资源回收的过程,这个时候docker还没正常启动,kubelet无法调用docker的socket接口对镜像回收,会导致每五分钟一次的循环检查,默认到100次就会触发gc,会导致kubelet的pleg不健康,这个启动顺序还是很重要的。

相关推荐
std860212 小时前
容器化入门:一文掌握Docker安装与核心概念
运维·docker·容器
2501_920047032 小时前
k8s-部署单master节点
云原生·容器·kubernetes
可爱的小小小狼3 小时前
k8s的kube-prosy
云原生·容器·kubernetes
腾讯数据架构师3 小时前
k8s 兼容摩尔线程
人工智能·云原生·容器·kubernetes·cube-studio
可爱的小小小狼3 小时前
k8s中的schedule
云原生·容器·kubernetes
桥边驿语人6 小时前
Docker 容器无法访问外网的问题排查与解决指南
运维·docker·容器
清静诗意6 小时前
在 Ubuntu 上通过 Docker 与 Docker Compose 部署项目的完整指南
linux·ubuntu·docker
阿里云云原生6 小时前
阿里云发布《AI 原生应用架构白皮书》
云原生
阿里云云原生7 小时前
阿里云 AI 中间件重磅发布,打通 AI 应用落地“最后一公里”
云原生·rocketmq
阿里云云原生8 小时前
从“看得见”到“能决策”:Operation Intelligence 重构企业智能运维新范式
云原生