K8S集群中驱逐节点

K8S集群中驱逐node节点

下面以驱逐节点上的GPU节点为例:

1.驱逐节点上的资源

使用以下命令从节点上驱逐 GPU 资源:

复制代码
kubectl drain <node-name> --delete-local-data --force --ignore-daemonsets

说明:

  • <node-name> 是要驱逐 GPU 的节点名称。
  • --delete-local-data 会删除节点上的本地数据。
  • --force 强制执行节点驱逐操作,即使节点上有未被调度的 Pod。
  • --ignore-daemonsets 忽略 DaemonSet 的 Pod,允许驱逐进行。

示例:

复制代码
kubectl drain gpu-node --delete-local-data --force --ignore-daemonsets

2.等待节点驱逐完成

Kubernetes 将会将节点上的 Pod 调度到其他节点上,等待所有 Pod 成功调度到其他节点后,节点才会完全驱逐完成。

复制代码
kubectl delete pod gpu-node

1.验证驱逐

使用以下命令确认节点已经成功驱逐,并且节点上的 GPU 资源不再被使用:

复制代码
kubectl get nodes

确保节点状态为 Ready,并且没有任何 Pod 在其上运行。

相关推荐
姚不倒2 小时前
负载均衡的概念、策略以及两个核心组件 Nginx 和 Kube-proxy 的对比。
运维·nginx·云原生·kubernetes
地瓜伯伯2 小时前
Nginx终极配置指南:负载均衡、限流、反向代理、IP白名单、SSL、云原生、DNS解析、缓存加速全都有
spring boot·nginx·spring·spring cloud·微服务·云原生·负载均衡
颜颜yan_6 小时前
在openEuler上搞个云原生AI模型商店:像点外卖一样部署模型
人工智能·云原生
阿里云云原生8 小时前
线下活动速递丨AI 原生应用开源开发者沙龙·杭州站
云原生
阿里云云原生8 小时前
MCP 网关实战:基于 Higress + Nacos 的零代码工具扩展方案
云原生·mcp
阿里云云原生9 小时前
UModel 查询:驯服“可观测性混乱”,阿里云的图模型建模利器!
云原生
水滴与鱼9 小时前
DOCKER制作ROS运行的镜像文件
运维·docker·容器
洒家肉山大魔王11 小时前
Kubernetes中Pod 处于 CrashLoopBackOff 状态(生产环境)
linux·容器·kubernetes·pod·pod循环重启
weixin_3077791312 小时前
采用Amazon SES解决电商邮件延迟:以最小化运维实现最大效率的方案选择
运维·云原生·架构·云计算·aws
Lynnxiaowen12 小时前
今天我们学习kubernetes内容Ingress资源对象
学习·容器·kubernetes