【云原生运维问题记录】kubesphere登录不跳转问题

文章目录

结论先行 :kubesphere-system名称空间下reids宕机重启,会判断是否通过registry-proxy重新拉取镜像,该镜像原本是通过阿里云上拉取,代理上没有出现超时情况,导致失败。
解决方案 :删除registry-proxy或修改registry-proxy配置

现象

kubesphere控制台点击登录不跳转

问题排查

  1. 查看kubesphere-system空间情况
yaml 复制代码
kubectl get all -n kubesphere-system

发现redis没起来

  1. kubesphere控制台模块ks-console,查看日志确认问题是什么引起
yaml 复制代码
kubectl logs <ks-console> -n kubesphere-system

结论:reids没起来导致的kubesphere登录不上

  1. 定位reids启动失败原因

由于reids pod没有创建 只能通过事件定位,查看kubesphere-system空间下事件

yaml 复制代码
kubectl get events  -n kubesphere-system
yaml 复制代码
m27s       Warning   FailedCreate        replicaset/redis-57f4b4584b                       Error creating: Internal error occurred: failed calling webhook "registry-proxy.registry-proxy.svc": failed to call webhook: Post "https://registry-proxy.registry-proxy.svc:443/mutate?timeout=3s": dial tcp 10.20.3.39:443: connect: connection refused

失败原因是通过registry-proxy调用错误,卸载registry-proxy,删除registry-proxy命名空间下所有资源,看是否恢复

  1. 卸载registry-proxy

卸载参考:https://ketches.cn/registry-proxy/

  1. 修改reids副本,重启
yaml 复制代码
kubectl scale deployment redis --replicas=0 -n kubesphere-system
kubectl scale deployment redis --replicas=1 -n kubesphere-system
  1. 查看部署情况
yaml 复制代码
kubectl get deployments -n kubesphere-system
  1. 再次登录成功
  1. registry-proxy用途还是比较大的,采用修改配置解决上述问题

配置参考:https://ketches.cn/registry-proxy/

修改默认配置:excludeNamespaces中添加kubesphere-system

yaml 复制代码
apiVersion: v1
kind: ConfigMap
metadata:
  name: registry-proxy-config
  namespace: registry-proxy
data:
  config.yaml: |
    enabled: true
    proxies:
      docker.io: docker.ketches.cn
      registry.k8s.io: k8s.ketches.cn
      quay.io: quay.ketches.cn
      ghcr.io: ghcr.ketches.cn
      gcr.io: gcr.ketches.cn
      k8s.gcr.io: k8s-gcr.ketches.cn
      docker.cloudsmith.io: cloudsmith.ketches.cn
    excludeNamespaces:
    - kube-system
    - kube-public
    - kube-node-lease
    - registry-proxy
    - kubesphere-system
    includeNamespaces:
    - *
相关推荐
梦白.6 小时前
Python的容器类型
运维·python
tuotali20268 小时前
天然气压缩机技术2026,高可靠性长周期运行与智能运维融合路径
运维·python
姚不倒8 小时前
三节点 TiDB 集群部署与负载均衡搭建实战
运维·数据库·分布式·负载均衡·tidb
gpio_018 小时前
自建gitlab服务器并用sakurafrp穿透
运维·服务器·gitlab
小二·8 小时前
Go 语言系统编程与云原生开发实战(第38篇)
网络·云原生·golang
k7Cx7e8 小时前
Debian执行ssh root@localhost 提示认证失败
运维·debian·ssh
闻道且行之8 小时前
Nginx 安装、做成服务及 HTTPS 配置全流程
linux·运维·nginx·https
人工智能训练8 小时前
Qwen3.5 开源全解析:从 0.8B 到 397B,代际升级 + 全场景选型指南
linux·运维·服务器·人工智能·开源·ai编程
蜕变的小白8 小时前
Linux系统编程-->UDP编程:C/S模型实战详解
linux·运维·网络协议·udp
小二·8 小时前
Go 语言系统编程与云原生开发实战(第39篇)
开发语言·云原生·golang