K8S集群中驱逐节点

K8S集群中驱逐node节点

下面以驱逐节点上的GPU节点为例:

1.驱逐节点上的资源

使用以下命令从节点上驱逐 GPU 资源:

复制代码
kubectl drain <node-name> --delete-local-data --force --ignore-daemonsets

说明:

  • <node-name> 是要驱逐 GPU 的节点名称。
  • --delete-local-data 会删除节点上的本地数据。
  • --force 强制执行节点驱逐操作,即使节点上有未被调度的 Pod。
  • --ignore-daemonsets 忽略 DaemonSet 的 Pod,允许驱逐进行。

示例:

复制代码
kubectl drain gpu-node --delete-local-data --force --ignore-daemonsets

2.等待节点驱逐完成

Kubernetes 将会将节点上的 Pod 调度到其他节点上,等待所有 Pod 成功调度到其他节点后,节点才会完全驱逐完成。

复制代码
kubectl delete pod gpu-node

1.验证驱逐

使用以下命令确认节点已经成功驱逐,并且节点上的 GPU 资源不再被使用:

复制代码
kubectl get nodes

确保节点状态为 Ready,并且没有任何 Pod 在其上运行。

相关推荐
AI攻城狮1 天前
OpenFang 给我的一个提醒:AI Agent 真正难的不是自主,而是治理
人工智能·云原生·aigc
Java陈序员1 天前
轻量强大!一款现代化的 Kubernetes 集群管理与监控工具!
云原生·容器·kubernetes
Johny_Zhao2 天前
OpenClaw中级到高级教程
linux·人工智能·信息安全·kubernetes·云计算·yum源·系统运维·openclaw
AI攻城狮3 天前
OpenClaw 里 TAVILY_API_KEY 明明写在 ~/.bashrc,为什么还是失效?一次完整排查与修复
人工智能·云原生·aigc
Sheffield3 天前
Alpine是什么,为什么是Docker首选?
linux·docker·容器
阿里云云原生4 天前
零配置部署顶级模型!函数计算一键解锁 Qwen3.5
云原生
AI攻城狮4 天前
Kimi Bot + OpenClaw 完整配置指南:5 步实现本地 AI Agent 集成
人工智能·云原生·aigc
AI攻城狮5 天前
RAG Chunking 为什么这么难?5 大挑战 + 最佳实践指南
人工智能·云原生·aigc
可观测性用观测云6 天前
云原生网关 Ingress-Nginx 链路追踪实战:OpenTelemetry 采集与观测云集成方案
nginx·kubernetes
哈里谢顿7 天前
Kubernetes Operator核心概念、实现原理和实战开发
云原生