K8S集群中驱逐节点

K8S集群中驱逐node节点

下面以驱逐节点上的GPU节点为例:

1.驱逐节点上的资源

使用以下命令从节点上驱逐 GPU 资源:

复制代码
kubectl drain <node-name> --delete-local-data --force --ignore-daemonsets

说明:

  • <node-name> 是要驱逐 GPU 的节点名称。
  • --delete-local-data 会删除节点上的本地数据。
  • --force 强制执行节点驱逐操作,即使节点上有未被调度的 Pod。
  • --ignore-daemonsets 忽略 DaemonSet 的 Pod,允许驱逐进行。

示例:

复制代码
kubectl drain gpu-node --delete-local-data --force --ignore-daemonsets

2.等待节点驱逐完成

Kubernetes 将会将节点上的 Pod 调度到其他节点上,等待所有 Pod 成功调度到其他节点后,节点才会完全驱逐完成。

复制代码
kubectl delete pod gpu-node

1.验证驱逐

使用以下命令确认节点已经成功驱逐,并且节点上的 GPU 资源不再被使用:

复制代码
kubectl get nodes

确保节点状态为 Ready,并且没有任何 Pod 在其上运行。

相关推荐
倚肆40 分钟前
windows安装docker(末尾附命令大全)
docker·容器
至此流年莫相忘2 小时前
Kubernetes实战篇之服务发现
容器·kubernetes·服务发现
归叶再无青3 小时前
web服务安装部署、性能升级等(Apache、Nginx)
运维·前端·nginx·云原生·apache·bash
Zaly.3 小时前
解决 Windows 下 Docker Desktop 启动失败:从虚拟化报错到成功运行的全流程
windows·docker·容器
梅孔立3 小时前
Docker 全场景安装与镜像管理实战教程(在线+内网离线+镜像导入导出)
运维·docker·容器
AC赳赳老秦3 小时前
云原生AI故障排查新趋势:利用DeepSeek实现高效定位部署报错与性能瓶颈
ide·人工智能·python·云原生·prometheus·ai-native·deepseek
only_Klein3 小时前
Kubernetes 版本升级
容器·kubernetes·upgrade
川trans3 小时前
云原生--Nginx
linux·运维·服务器·nginx·云原生
白云偷星子3 小时前
云原生笔记2
运维·笔记·云原生
Elastic 中国社区官方博客4 小时前
使用 Jina Embeddings v5 和 Elasticsearch 构建“与你的网站数据聊天”的 agent
大数据·人工智能·elasticsearch·搜索引擎·容器·全文检索·jina