云计算案例排错(云上3)

故障1

CPU&内存配额错误

solo-1工作负载启动失败,提示:重启启动容器失败。

解决方案:看下solo-1的更新升级中的容器规划配置,是否是正确的配置(CPU配额:申请0.25Core 限制0.29Core;内存配额:申请512MiB 限制998.4MiB)另一个8090配额为(CPU 0.25Core 限制0.45Core;内存 512MiB 限制1996.8MiB)

故障点2!

solo-1工作负载启动失败

solo-1工作负载启动失败

分析:1.solo-1工作负载的yaml文件初始化容器参数错误

2.solo-1工作负载的yaml文件探针参数错误

3.solo节点EIP地址没有了提示:Check tables failed

4.第一题目的ECS的mysql的EIP与dockerfile文件的EIP不一致,无法与数据库通信提示:Check tables failed

5.第一题目的ECS的mysql安全组入方向规则删除3306端口提示:Check tables failed

6.solo集群的2个安全组出方向规则将远端的any改为安全组,非any

解决方案:1.将solo-1工作负载的yaml文件里初始化容器参数改为正确的

2.将solo-1工作负载的yaml文件探针修改为正确的

3.将solo节点绑定eip

4.将第一题的目的ECS的mysql的EIP换成与dockerfile文件中的EIP地址一致

5.将第一题的目的ECS的mysql入向安全组规则加上3306端口

6.将solo集群的2个安全组的出向规则远端改为any

说明:solo节点重新绑定EIP,等solo-1工作负载起来后可能会不看外部访问地址,此时需要去节点管理将所有节点的信息进行同步(节点右边更多--同步节点信息)

故障3

ingress访问失败

网页报错为404或502错误

分析:此问题是solo-1工作负载发生问题导致,工作负载为 未就绪状态

解决方案:参考上个步骤

故障4

ingress访问失败,域名无法访问

分析:hosts文件被修改了

解决方案:将hosts总的域名和地址映射为正确的

相关推荐
tiancaijiben4 天前
阿里云Kubernetes集群托管完全指南:从创建到生产级运维
云计算
互联网推荐官4 天前
上海软件定制开发公司推荐:从PaaS工程化路径看D-coding的技术取舍
云原生·云计算·paas·软件开发·开发经验·上海
sbjdhjd4 天前
从零搭建企业级 CI/CD(下):Jenkins+GitLab+Harbor 全链路实战指南
git·servlet·ci/cd·云原生·云计算·gitlab·jenkins
tiancaijiben4 天前
阿里云应用实时监控服务ARMS完全接入指南:从探针部署到全链路可观测
云计算
xingyuzhisuan5 天前
算力租赁平台 GPU 资源隔离方案:显存抢占问题深度排查与解决
大数据·云计算·gpu算力
workbuddy小能手5 天前
腾讯云ADP Agent Portal vs 自建智能体:架构选型对比
架构·云计算·腾讯云
宸津-代码粉碎机5 天前
Spring AI 企业级实战|智能记忆摘要+自动遗忘机制落地,彻底解决上下文爆炸与Token冗余
java·大数据·人工智能·后端·python·spring·云计算
tiancaijiben5 天前
阿里云Elasticsearch搭建网站站内搜索功能:从零到生产级实战指南
云计算
tiancaijiben5 天前
阿里云Linux云服务器搭建Joomla基础管理平台:从零到企业级部署
云计算