K8S集群中驱逐节点

K8S集群中驱逐node节点

下面以驱逐节点上的GPU节点为例:

1.驱逐节点上的资源

使用以下命令从节点上驱逐 GPU 资源:

复制代码
kubectl drain <node-name> --delete-local-data --force --ignore-daemonsets

说明:

  • <node-name> 是要驱逐 GPU 的节点名称。
  • --delete-local-data 会删除节点上的本地数据。
  • --force 强制执行节点驱逐操作,即使节点上有未被调度的 Pod。
  • --ignore-daemonsets 忽略 DaemonSet 的 Pod,允许驱逐进行。

示例:

复制代码
kubectl drain gpu-node --delete-local-data --force --ignore-daemonsets

2.等待节点驱逐完成

Kubernetes 将会将节点上的 Pod 调度到其他节点上,等待所有 Pod 成功调度到其他节点后,节点才会完全驱逐完成。

复制代码
kubectl delete pod gpu-node

1.验证驱逐

使用以下命令确认节点已经成功驱逐,并且节点上的 GPU 资源不再被使用:

复制代码
kubectl get nodes

确保节点状态为 Ready,并且没有任何 Pod 在其上运行。

相关推荐
阿里云云原生1 小时前
阿里云 AI 网关支持 DeepSeek V4
云原生
阿里云云原生1 小时前
从可观测到可理解:用 UModel 构建 Agent 原生的代码知识图谱
云原生
阿里云云原生2 小时前
OpenClaw、Hermes合用?来自500+社区互动的真实看法
云原生
AI攻城狮5 小时前
开源工具也有山寨陷阱:一个假 Hermes Agent 网站如何收割不明真相的用户
云原生
阿里云云原生5 小时前
人机共跑半马,赛场之外的具身智能规模化运维大考
云原生
宁静@星空5 小时前
007-Docker构建 jar 包成镜像
docker·容器·jar
A-刘晨阳7 小时前
K8s之负载均衡
linux·运维·容器·kubernetes·负载均衡
米高梅狮子8 小时前
11.Quota and Limits、健康检查和认证与授权
云原生·容器·架构·kubernetes·自动化
AI攻城狮9 小时前
把 Markdown 笔记变成可问答的知识图谱:本地 Graph RAG 工具 Kwipu 实测
云原生
虎头金猫9 小时前
监控机不在被监控的机器上,Prometheus怎么跨网络把数据拉过来
运维·服务器·开发语言·网络·云原生·开源·prometheus