【K8s】工作以来遇到的K8s相关问题、故障

工作以来遇到的有关K8S相关问题及故障

  1. deployments 资源 2副本情况下,一个springboot的pod能访问,一个不能(端口不通)
  2. 在K8S运维(多人管理) 不知道谁在链路加了个跨域配置,导致前端打不开图片
  3. 某些安全部门演练时经常在不通知我们的情况下渗透我们,我们需要通过istio的authorizationPolicy关闭某些后台的访问
  4. 测试环境的K8S资源不足,导致集群pod集体重启,需要缩减pod副本数
  5. 重大节假日(如国庆)需要紧急应对并发压力,所以演练接口的限流,通过istio实现
  6. 开发反馈测试集群的平台打不开,发现负载均衡器带宽占满,有多个ip重复请求一个视频资源(回源了),找云平台的安全专家解决不了(我们整个架构都在云上)
  7. 某部分服务器节点时间出现不同步(chronyd挂掉了),导致pod业务在交易的时间与对端系统不一致,记录的提交订单时间竟然比支付订单的时间都要迟,出现一堆异常订单
  8. 支付微服务有反馈不能发起支付,测试时有时行有时不行。经过沟通问开发拿到接口地址,进行curl测试,发现第三方支付系统的域名会解析到两个ip,一个ip能通,一个不通
  9. 支付服务创建订单失败,某个节点资源分配不均导致pod重启,所以有支付的请求会失败
  10. 微服务出现告警,经过日志分析,是集群内nacos statefulset部分节点发生重启导致
  • 以上内容明天补全
相关推荐
2501_924064119 小时前
2025年优测平台:微服务全链路性能瓶颈分析与最佳实践
微服务·云原生·架构·性能瓶颈·全链路性能
石小千9 小时前
Ubuntu24.04 安装Docker
运维·docker·容器
scriptsboy10 小时前
Halo Docker 迁移方法
运维·docker·容器
隐语SecretFlow10 小时前
【隐语Secretflow】一文速通基于可信执行环境 (TEE) 的零信任计算系统
云原生·kubernetes·开源
R.lin10 小时前
Docker核心原理详解
运维·docker·容器
MarkHD10 小时前
车辆TBOX科普 第70次 AUTOSAR Adaptive、容器化与云原生的融合革命
云原生·wpf
Dobby_0511 小时前
【k8s】集群安全机制(一):认证
运维·安全·kubernetes
测试人社区-小明11 小时前
测试领域的“云原生”进化:Serverless Testing
人工智能·科技·云原生·面试·金融·serverless·github
阿基米东11 小时前
Traefik:为云原生而生的自动化反向代理
运维·云原生·自动化
纷飞梦雪11 小时前
排查k8s连接mysql的pod
云原生·容器·kubernetes