k8s重启后报错Error getting node not found

今天升级一台3主的k8s集群的配置。升级其中一台后另外两个节点就出现Not Ready的状态。

升级之前最好把一些能停的应用停掉。或者能够通过增加临时节点来进行扩容,不然所有pod调度到其他节点,可能把其他节点压垮。没办法,只能把其他两台直接升级配置,然后重启。重启之后三台中有两台Not Ready。节点的Not Ready的凭据是kubelet上报的数据,所以首先重启下kubelet:

systemctl restart kubelet

重启后依然是Not Ready, 于是在Not Ready的节点上查看kubelet的日志:

# 查看Kubelet的所有日志
sudo journalctl -u kubelet

# 查看最近的Kubelet日志
sudo journalctl -u kubelet -r

# 查看最近两小时的Kubelet日志
sudo journalctl -u kubelet --since "2 hours ago"

发现报错:

"Error getting node" err="node \"txbj-164020-prod-tb-kubelet\" not found"

于是对比现在的主机名,发现确实不一样,于是使用hostnamectl修改主机名并重启kubelet:

hostnamectl set-hostname txbj-164020-prod-tb-kubelet
systemctl restart kubelet

最后恢复正常

但是不知道为什么在控制台重启后主机名为什么会变,总之把我搞紧张了。

相关推荐
biass14 分钟前
k8s公网集群安装(1.23.0)
云原生·容器·kubernetes
孤城28621 分钟前
01 Docker 概述
docker·云原生·容器·devops·虚拟机
华为云开发者联盟4 小时前
以Java项目为例,实现Jenkins对接CCE Autopilot集群
java·容器·kubernetes
华为云开发者联盟6 小时前
从零开始带你上手体验Sermant自定义插件开发
微服务·云原生·开源·华为云开发者联盟
zhang98800006 小时前
docker liunx的底层逻辑是什么,docker 的原理是什么?怎么部署及应用,Docker的来龙去脉
docker·容器·eureka
向上慢爬的蜗牛12 小时前
k8s架构设计思想
云原生·容器·kubernetes
Jiangxl~16 小时前
第32讲:K8S集群与Cephfs文件系统集成
java·运维·服务器·docker·云原生·性能优化·kubernetes
若水@18 小时前
yaml文件的介绍-K8S
云原生·容器·kubernetes
老刘pro21 小时前
[2024]docker-compose实战 (1)前言
运维·docker·容器
研究司马懿1 天前
【云原生】Kubernetes高级功能
云原生·容器·kubernetes·k8s·高级技术