K8S集群中驱逐节点

K8S集群中驱逐node节点

下面以驱逐节点上的GPU节点为例:

1.驱逐节点上的资源

使用以下命令从节点上驱逐 GPU 资源:

复制代码
kubectl drain <node-name> --delete-local-data --force --ignore-daemonsets

说明:

  • <node-name> 是要驱逐 GPU 的节点名称。
  • --delete-local-data 会删除节点上的本地数据。
  • --force 强制执行节点驱逐操作,即使节点上有未被调度的 Pod。
  • --ignore-daemonsets 忽略 DaemonSet 的 Pod,允许驱逐进行。

示例:

复制代码
kubectl drain gpu-node --delete-local-data --force --ignore-daemonsets

2.等待节点驱逐完成

Kubernetes 将会将节点上的 Pod 调度到其他节点上,等待所有 Pod 成功调度到其他节点后,节点才会完全驱逐完成。

复制代码
kubectl delete pod gpu-node

1.验证驱逐

使用以下命令确认节点已经成功驱逐,并且节点上的 GPU 资源不再被使用:

复制代码
kubectl get nodes

确保节点状态为 Ready,并且没有任何 Pod 在其上运行。

相关推荐
IT老胡8 分钟前
Docker入门与实操(1):Docker简介
运维·docker·容器
仅此,15 分钟前
docker 方式,postgreSQL18 安装 jieba 分词器扩展
运维·docker·postgresql·容器·中文分词·jieba
A-刘晨阳23 分钟前
【云原生】PromQL 常用内置指标
云原生·grafana·prometheus·promql
AI_567825 分钟前
云原生监控体系构建指南:基于Prometheus与Grafana的企业级实践
云原生·grafana·prometheus
VicdorLin1 小时前
docker报错: client version 1.24 is too old. Minimum supported API version is 1.44
运维·docker·容器
我是koten1 小时前
K8s启动pod失败,日志报非法的Jar包排查思路(Invalid or corrupt jarfile /app/xxxx,jar)
java·docker·容器·kubernetes·bash·jar·shell
回忆是昨天里的海1 小时前
docker compose-语法
运维·docker·容器
J_liaty1 小时前
Docker 部署 Spring Boot 项目完整指南:从零到生产环境
spring boot·docker·容器
利刃大大1 小时前
【Docker】核心概念 && 常用指令总结 && Docker Compose
docker·容器
tzhou644522 小时前
云原生与K8S入门
云原生·容器·kubernetes