如何完整删除rancher中已接入的rancher集群并重新导入

前提:如果手动删除kubectl delete all --all --namespace=<namespace>删除不了的情况下可以使用此方案

一:查找rancher接入集群的所有namespace

接入rancher的k8s集群namespace都是以cattle命名的

复制代码
root@A800-gpu-node01:~# kubectl get namespaces | grep cattle
cattle-fleet-system                    Active        152m
cattle-impersonation-system            Active        164m
cattle-system                          Terminating   170m

namespace处于Terminating状态通过手动删除kubectl delete namespace cattle-fleet-system是无法删除的,通常是由于finalizers卡住导致的,需要修改yaml文件去解决无法删除的问题

二:修改finalizers的yaml文件内容删除finalizers部分配置

复制代码
NAMESPACE=cattle-fleet-system

kubectl get namespace $NAMESPACE -o json > ns.json

# 手动编辑 ns.json 文件,删除 "spec.finalizers" 的数组部分。

三:替换修养完的finalizers的yaml文件内容并应用生效

复制代码
kubectl replace --raw "/api/v1/namespaces/$NAMESPACE/finalize" -f ./ns.json

四:查看刚才Terminating的namespace是否删除成功

复制代码
oot@A800-gpu-node01:~# kubectl get namespaces | grep cattle
cattle-impersonation-system            Terminating   176m
cattle-system                          Terminating   3h1m

可以看到这次删除成功了,其他的资源删除方法一致

五:为了确保所有可能的资源都已删除,可以尝试删除特定资源类型:

复制代码
for ns in cattle-fleet-system cattle-impersonation-system cattle-system; do
  kubectl delete all --all -n $ns
  kubectl delete pvc --all -n $ns
  kubectl delete configmap --all -n $ns
  kubectl delete secret --all -n $ns
  kubectl delete ingress --all -n $ns
  kubectl delete role --all -n $ns
  kubectl delete rolebinding --all -n $ns
done

六:如果还有什么附带的资源没有删除干净,可以用这个命令强制删除

复制代码
对于无法通过标准方式删除的资源,使用 --grace-period=0 --force 强制删除:

kubectl delete pod <pod-name> -n <namespace-name> --grace-period=0 --force

七:重新导入k8s集群

先查看node节点kubelet配置中的USER_ACCOUNT,默认是default-auth

复制代码
ps -ef| grep kubelet

查看文件里边的默认用户是什么

八:添加权限用户

复制代码
 kubectl create clusterrolebinding cluster-admin-binding --clusterrole cluster-admin --user default-auth

如果已有这一步可以忽略

九:通过yaml配置部署集群

复制代码
kubectl apply -f https://10.10.2.100:8443/v3/import/gvs9zvjhgjhvgxhcnqqngfj7sq7hk49g77pxlwtvxcjrfczgmqtnnv_c-m-cr9j4xcs.yaml

也可以在浏览器访问yaml的文件路径,拷贝文件内容到记事本里边,配置本地已有的镜像

然后在要接入的k8s集群的matserk节点kubectl create -f *.yaml去创建rancher的接入配置

十:如果新建的时候报错这些如何解决

(1)详细报错信息

强制删除某个名称空间后,再创建提示报错如下:

Error from server (InternalError): Internal error occurred: failed calling webhook "rancher.cattle.io.namespaces.create-non-kubesystem": failed to call webhook: Post "https://rancher-webhook.cattle-system.svc:443/v1/webhook/validation/namespaces?timeout=10s": service "rancher-webhook" not found

(2)解决方案

root@k8s-master rancher# kubectl get ValidatingWebhookConfiguration

root@k8s-master rancher# kubectl delete ValidatingWebhookConfiguration rancher.cattle.io

然后重新新建namespace

相关推荐
运维开发故事15 小时前
基于 Arthas 的多集群在线诊断系统设计与实现
kubernetes
Patrick_Wilson2 天前
从「改个端口」到 502:Next.js on k8s 的容器端口、Service 映射与 env 覆盖
docker·kubernetes·next.js
探索云原生3 天前
K8s 1.36 这个 GA 特性,把 initContainer 拉模型的 hack 干掉了
ai·云原生·kubernetes
云恒要逆袭3 天前
运行你的第一个Docker容器
后端·docker·容器
Java之美4 天前
一次k8s升级引发的DevicePlugin注册失败
云原生·kubernetes
程序员老赵4 天前
10 分钟部署 OpenCode:Docker 一键安装,浏览器打开就能用 AI 写代码(附完整命令与排错)
docker·容器·ai编程
武子康8 天前
调查研究-183 Apple container:Mac 上用轻量 VM 跑 Linux 容器,Swift 会改写本地容器体验吗?
docker·容器·apple
2601_9618752411 天前
决战申论100题2026|最新|范文
linux·容器·centos·debian·ssh·fabric·vagrant
java_cj11 天前
深入kube-apiserver认证机制:从Bearer Token到mTLS的完整认证链解析
linux·运维·服务器·云原生·容器·kubernetes