K8S集群中驱逐节点

K8S集群中驱逐node节点

下面以驱逐节点上的GPU节点为例:

1.驱逐节点上的资源

使用以下命令从节点上驱逐 GPU 资源:

复制代码
kubectl drain <node-name> --delete-local-data --force --ignore-daemonsets

说明:

  • <node-name> 是要驱逐 GPU 的节点名称。
  • --delete-local-data 会删除节点上的本地数据。
  • --force 强制执行节点驱逐操作,即使节点上有未被调度的 Pod。
  • --ignore-daemonsets 忽略 DaemonSet 的 Pod,允许驱逐进行。

示例:

复制代码
kubectl drain gpu-node --delete-local-data --force --ignore-daemonsets

2.等待节点驱逐完成

Kubernetes 将会将节点上的 Pod 调度到其他节点上,等待所有 Pod 成功调度到其他节点后,节点才会完全驱逐完成。

复制代码
kubectl delete pod gpu-node

1.验证驱逐

使用以下命令确认节点已经成功驱逐,并且节点上的 GPU 资源不再被使用:

复制代码
kubectl get nodes

确保节点状态为 Ready,并且没有任何 Pod 在其上运行。

相关推荐
阿里云云原生2 天前
阿里云获评 Agentic AI 开发平台领导者,函数计算 AgentRun 赢下关键分!
云原生
蝎子莱莱爱打怪2 天前
Centos7中一键安装K8s集群以及Rancher安装记录
运维·后端·kubernetes
崔小汤呀2 天前
Docker部署Nacos
docker·容器
缓解AI焦虑2 天前
Docker + K8s 部署大模型推理服务:资源划分与多实例调度
docker·容器
阿里云云原生2 天前
MSE Nacos Prompt 管理:让 AI Agent 的核心配置真正可治理
微服务·云原生
阿里云云原生3 天前
当 AI Agent 接管手机:移动端如何进行观测
云原生·agent
阿里云云原生3 天前
AI 原生应用开源开发者沙龙·深圳站精彩回顾 & PPT下载
云原生
阿里云云原生3 天前
灵感启发:日产文章 100 篇,打造“实时热点洞察”引擎
云原生
1candobetter3 天前
Docker Compose Build 与 Up 的区别:什么时候必须重建镜像
docker·容器·eureka
~莫子3 天前
Haproxy七层负载详解+实验详细代码
云原生