云计算案例排错(云上3)

故障1

CPU&内存配额错误

solo-1工作负载启动失败,提示:重启启动容器失败。

解决方案:看下solo-1的更新升级中的容器规划配置,是否是正确的配置(CPU配额:申请0.25Core 限制0.29Core;内存配额:申请512MiB 限制998.4MiB)另一个8090配额为(CPU 0.25Core 限制0.45Core;内存 512MiB 限制1996.8MiB)

故障点2!

solo-1工作负载启动失败

solo-1工作负载启动失败

分析:1.solo-1工作负载的yaml文件初始化容器参数错误

2.solo-1工作负载的yaml文件探针参数错误

3.solo节点EIP地址没有了提示:Check tables failed

4.第一题目的ECS的mysql的EIP与dockerfile文件的EIP不一致,无法与数据库通信提示:Check tables failed

5.第一题目的ECS的mysql安全组入方向规则删除3306端口提示:Check tables failed

6.solo集群的2个安全组出方向规则将远端的any改为安全组,非any

解决方案:1.将solo-1工作负载的yaml文件里初始化容器参数改为正确的

2.将solo-1工作负载的yaml文件探针修改为正确的

3.将solo节点绑定eip

4.将第一题的目的ECS的mysql的EIP换成与dockerfile文件中的EIP地址一致

5.将第一题的目的ECS的mysql入向安全组规则加上3306端口

6.将solo集群的2个安全组的出向规则远端改为any

说明:solo节点重新绑定EIP,等solo-1工作负载起来后可能会不看外部访问地址,此时需要去节点管理将所有节点的信息进行同步(节点右边更多--同步节点信息)

故障3

ingress访问失败

网页报错为404或502错误

分析:此问题是solo-1工作负载发生问题导致,工作负载为 未就绪状态

解决方案:参考上个步骤

故障4

ingress访问失败,域名无法访问

分析:hosts文件被修改了

解决方案:将hosts总的域名和地址映射为正确的

相关推荐
暮雨疏桐1 天前
阿里云函数计算部署广告数据ETL方案
阿里云·云计算
天草二十六_简村人1 天前
对接AI大模型之nginx代理配置SSE接口
运维·网络·nginx·http·阿里云·ai·云计算
yyuuuzz1 天前
独立站部署的几个常见技术问题
运维·服务器·网络·云计算·aws
China_Yanhy1 天前
AWS RDS PostgreSQL 大版本升级故障复盘与 SRE 最佳实践指南
运维·云计算·aws
HehuaTang1 天前
IPOIB TCP ROCE IB 性能比较
网络·云计算
ZStack开发者社区2 天前
青海交科携手云轴科技ZStack为青海交控集团打造智慧物流大数据平台
大数据·服务器·科技·云计算·gpu算力
yyuuuzz2 天前
aws亚马逊云上部署常见问题梳理
运维·服务器·网络·数据库·云计算·aws
Hy行者勇哥2 天前
阿里云百炼平台技术文档
阿里云·云计算
TG_yunshuguoji2 天前
阿里云代理商:DeepSeek V4 API接入全攻略 + 云服务器部署指南
运维·阿里云·云计算·ai智能体·deepseek-v4
EAIReport2 天前
深度拆解WorkBuddy技术实现:腾讯云全场景AI智能体的架构设计与核心逻辑
人工智能·云计算·腾讯云