k8s重启后报错Error getting node not found

今天升级一台3主的k8s集群的配置。升级其中一台后另外两个节点就出现Not Ready的状态。

升级之前最好把一些能停的应用停掉。或者能够通过增加临时节点来进行扩容,不然所有pod调度到其他节点,可能把其他节点压垮。没办法,只能把其他两台直接升级配置,然后重启。重启之后三台中有两台Not Ready。节点的Not Ready的凭据是kubelet上报的数据,所以首先重启下kubelet:

systemctl restart kubelet

重启后依然是Not Ready, 于是在Not Ready的节点上查看kubelet的日志:

复制代码
# 查看Kubelet的所有日志
sudo journalctl -u kubelet

# 查看最近的Kubelet日志
sudo journalctl -u kubelet -r

# 查看最近两小时的Kubelet日志
sudo journalctl -u kubelet --since "2 hours ago"

发现报错:

"Error getting node" err="node \"txbj-164020-prod-tb-kubelet\" not found"

于是对比现在的主机名,发现确实不一样,于是使用hostnamectl修改主机名并重启kubelet:

复制代码
hostnamectl set-hostname txbj-164020-prod-tb-kubelet
systemctl restart kubelet

最后恢复正常

但是不知道为什么在控制台重启后主机名为什么会变,总之把我搞紧张了。

相关推荐
掘根15 分钟前
【微服务即时通讯】登录注册界面设计
微服务·云原生·架构
bukeyiwanshui25 分钟前
20260509 docker项目总结
运维·docker·容器
谁在黄金彼岸41 分钟前
Docker Compose删除服务后,docker compose down无法关闭的问题解决
docker·容器
数据智能老司机1 小时前
使用 Docker 构建可落地运行的 AI 系统——Docker Desktop:AI/ML 工作流的运行时基础
docker·容器
非情剑1 小时前
Tlog实现微服务日志追踪
微服务·云原生·架构
小小仙。1 小时前
IT自学第四十一天(微服务)
微服务·云原生·架构
志栋智能1 小时前
超自动化巡检:敏捷运维体系中的重要一环
运维·服务器·网络·云原生·容器·kubernetes·自动化
东北甜妹3 小时前
K8s job /cronjob 和 Networkpolicy
云原生·容器·kubernetes
Harvy_没救了3 小时前
【容器技术-Docker】Docker镜像
运维·docker·容器
hyunbar3 小时前
ZooKeeper 未授权访问漏洞:你做的 ACL 加固可能只是“假动作”
分布式·zookeeper·云原生