k8s节点not ready

开发小伙伴反应,发布应用失败。检查后发现有个虚拟机挂掉了

启动后先重启服务:(一般是自启动,自动拉起pod服务)

service docker restart

docker ps |grep kube-apiserver|grep -v pause|awk '{print $1}'|xargs -i docker restart {}

docker ps |grep kube-controller-manage|grep -v pause|awk '{print $1}'|xargs -i docker restart {}

docker ps |grep kube-scheduler|grep -v pause|awk '{print $1}'|xargs -i docker restart {}

以上重启之后,还没有恢复。

通过describe node,发现有其他报错。

Warning ContainerGCFailed 35s (x7 over 6m55s) kubelet, worker2k8s rpc error: code = ResourceExhausted desc = grpc: trying to send message larger than max (16777879 vs. 16777216)

暴力操作:(一般不建议)

• 目标:先控制不可调度,然后将原来的 Pod 驱逐、排干• 首先,将原来的 Pod 驱逐到其他节点重新创建运行• 然后,将节点标识为 SchedulingDisabled 状态,也就是禁止调度• 具体命令:

kubectl drain node name --force --ignore-daemonsets --delete-local-data

--force: 就算 Pod 不被 ReplicationController、ReplicaSet、Job、DaemonSet、StatefulSet 等控制器管理,也直接处理;不加 force 参数只会删除该Node 节点上前面提到的几个控制器类型的 Pod,加上之后所有的 Pod 都将删除

--ignore-daemonsets: 忽略 DeamonSet 管理的 Pod,否则 DaemonSet 被删除后,仍会自动重建

--delete-local-data: 删除本地数据,即使 emptyDir 也将删除

• 恢复调度命令:

kubectl uncordon node name

• drain 执行的方式是比较安全的,它会等到 Pod 容器应用程序优雅的停止之后再删除• 详细的过程:先在当前节点删除 Pod,然后再在其他节点创建对应的 Pod。因此为了保证 Drain 驱逐过程中不中断服务,必须保证要驱逐的 Pod 副本的数量大于 1,并且采用"反亲和"策略将这些 Pod 调度到不同的节点。这样子可以保证驱逐过程对服务没有影响。

好吧,资源都看不到了。

踢出pod没用的话,那就把node也先踢出,再加入。

node2:

kubeadm reset

rm -rf * /etc/kubernetes/

master:

kubeadm token create --print-join-command

分析:

node2,pod太多,导致内存溢出。驱逐pod node,重新分配

相关推荐
鹤落晴春7 小时前
【K8s】Pod调度、configMaps
云原生·容器·kubernetes
张忠琳7 小时前
【runc 1.4.2】(Part 2)runc 1.4.2 超深度分析 — CLI层:main.go、命令文件、runner、信号处理、TTY
云原生·kubernetes·runc
极客先躯8 小时前
高级java每日一道面试题-2026年02月02日-实战篇[Docker]-如何实现容器的持久化存储?
docker·容器·面试宝典·持久化·存储·韵味·java高级面试题
阿里云云原生9 小时前
AI 提效是“假象”还是“红利”?用 LoongSuite + SLS 构建组织级 AI 编码度量看板
云原生
极客先躯9 小时前
高级java每日一道面试题-2026年02月01日-实战篇[Docker]-Docker Volume 的生命周期管理是怎样的?
java·运维·docker·容器·持久化·架构图·容器卷
Java识堂10 小时前
如何对微服务进行拆分?
微服务·云原生·架构
某林21211 小时前
Isaac Sim 5.1.0 无头服务器部署与 RTX 显存段错误排障全记录
运维·服务器·docker·容器·isaac
m0_7381207211 小时前
Docker 环境下 Vulfocus 靶场搭建全流程(附镜像源问题解决方案)
运维·服务器·网络·安全·docker·容器
Plastic garden13 小时前
K8s知识(3) Pod亲和性,调度
云原生·容器·kubernetes