解决kubelet报failed to get imageFs info: non-existent label \“docker-images\“

问题:

一环境主机重启后,查看kubelet日志经常有大量无法回收镜像文件报错,会导致kubelet的pleg不健康,从而导致kubelet发生重启。报错如下:

解决办法

解决方法一:

systemctl stop docker

systemctl stop kubelet

systemctl start docker

systemctl start kubelet

解决方法二:

在kubelet的kubelet.service文件中,添加如下参数:

Unit

After=docker.service

原因总结: 主机重启后,kubelet比docker先启动,会对不健康的pod进行一个资源回收的过程,这个时候docker还没正常启动,kubelet无法调用docker的socket接口对镜像回收,会导致每五分钟一次的循环检查,默认到100次就会触发gc,会导致kubelet的pleg不健康,这个启动顺序还是很重要的。

相关推荐
vpk1121 天前
Docker 安装与常用命令
运维·docker·容器
Volunteer Technology1 天前
zookeeper基础应用与实战二
分布式·zookeeper·云原生
不吃香菜kkk、1 天前
夜莺n9e+监控K8s集群+自定义监控页面
运维·云原生·云计算
匀泪1 天前
云原生(docker私有仓库)
云原生
vpk1121 天前
Docker Compose 常用命令大全
docker·容器·eureka
johnny2331 天前
Docker生态工具:Portainer、LazyDocker、Dockge、App2Docker
docker
廿一夏1 天前
搭建Ubuntu 虚拟机与部署docker
linux·ubuntu·docker
last demo1 天前
docker容器监控
运维·docker·容器
CSH0561 天前
k8s生产集群主机批量重启后,大量Pod启动失败故障排查复盘
docker·容器·kubernetes
柯儿的天空1 天前
【OpenClaw 全面解析:从零到精通】第 014 篇:OpenClaw 云端部署实战——阿里云、腾讯云与 Docker 部署全指南
人工智能·阿里云·docker·云计算·aigc·腾讯云·ai写作