【K8s】工作以来遇到的K8s相关问题、故障

工作以来遇到的有关K8S相关问题及故障

  1. deployments 资源 2副本情况下,一个springboot的pod能访问,一个不能(端口不通)
  2. 在K8S运维(多人管理) 不知道谁在链路加了个跨域配置,导致前端打不开图片
  3. 某些安全部门演练时经常在不通知我们的情况下渗透我们,我们需要通过istio的authorizationPolicy关闭某些后台的访问
  4. 测试环境的K8S资源不足,导致集群pod集体重启,需要缩减pod副本数
  5. 重大节假日(如国庆)需要紧急应对并发压力,所以演练接口的限流,通过istio实现
  6. 开发反馈测试集群的平台打不开,发现负载均衡器带宽占满,有多个ip重复请求一个视频资源(回源了),找云平台的安全专家解决不了(我们整个架构都在云上)
  7. 某部分服务器节点时间出现不同步(chronyd挂掉了),导致pod业务在交易的时间与对端系统不一致,记录的提交订单时间竟然比支付订单的时间都要迟,出现一堆异常订单
  8. 支付微服务有反馈不能发起支付,测试时有时行有时不行。经过沟通问开发拿到接口地址,进行curl测试,发现第三方支付系统的域名会解析到两个ip,一个ip能通,一个不通
  9. 支付服务创建订单失败,某个节点资源分配不均导致pod重启,所以有支付的请求会失败
  10. 微服务出现告警,经过日志分析,是集群内nacos statefulset部分节点发生重启导致
  • 以上内容明天补全
相关推荐
l1t3 小时前
用docker安装测试crate数据库
数据库·docker·容器·cratedb
平行云PVT3 小时前
数字孪生信创云渲染技术解析:从混合信创到全国产化架构
linux·unity·云原生·ue5·图形渲染·webgl·gpu算力
heimeiyingwang4 小时前
【架构实战】云原生架构设计原则
云原生·架构
枕书4 小时前
实战记录:如何使用 Docker 一键部署长亭 PandaWiki 智能知识库
运维·docker·容器
Cyber4K6 小时前
【妙招系列】Harbor 镜像私有仓库搭建手册
linux·云原生·容器
王码码20357 小时前
Flutter for OpenHarmony:Flutter 三方库 algoliasearch 毫秒级云端搜索体验(云原生搜索引擎)
android·前端·git·flutter·搜索引擎·云原生·harmonyos
IT19958 小时前
Docker笔记-对docker-compose.yml基本认识
笔记·docker·容器
阿里云云原生8 小时前
同学,你好!阿里云云原生 2027 实习生招聘启动
云原生
阿里云云原生9 小时前
一行命令,给你的 OpenClaw 龙虾装上 X 光机——阿里云可观测,让养虾更经济更安全
云原生
阿里云云原生10 小时前
SLS 智能问答助手:秒解游戏运营客服难题
云原生