云计算案例排错(云上4)

故障点1

PV/PVC创建失败

提示:error:error parsing nfs-pv.yaml:error converting YAM to JSON: yaml: line 9: cloud not find expooteec ' : '

解决方案:PV/PVC文件中缺少了 :号,找到缺少的补上即可

故障点2

创建PV和PVC时状态不是bound状态

解决方案:删除pv/pvc,使用命令:kubectl delete pvc nfs-pvc (和kubectl delete pv nfs-pv)

说明:先删除pvc再删除pv,且不能有工作负载(pod)运行。强制删除命令慎用:删除PVC是kubectl delete pvc pvc的名字 --force --grace-period=0;删除PV是 kubectl delete pv pv的名字 --force --grace-period=0 忘记了可以使用kubectl delete -f --help帮助命令去查看

故障点3!(做完复制yaml出来)

solo-2工作负载启动失败

1.solo-2提示找不到volumes启动失败,先提示实例调度失败,再提示实例挂在卷失败 (Unable to attach or mount volmes:unmounted volumes)

分析:可能是对等体或云连接没有了(ping一下99.0.0.100源)

2.solo-2提示:java: no found;分析yaml文件错误

3.提示:Check tables failed;分析soloEIP丢失

4.提示:Check tables failed;分析目标ECS的EIP与dockerfile文件不一致

5.提示:Check tables failed;分析目标ECS安全组入向规则端口缺少

6.提示:Check tables failed;分析solo集群的2个安全组的出方向规则做了修改,远端非any

解决方案:

1.创建对等体和路由或云连接

2.修改正确的yaml文件拿之前做的对比一下

3.solo节点绑定EIP

4.将dockerfile文件中的EIP地址与目标ECS的EIP地址一致

5.目标ECS的安全组中添加正确的端口

6.将solo集群2个安全组的出方向远端改为any

说明:如果solo-2的外部地址已经不可访问了,但是状态还是运行中的,那么手动删除pod后会自动生成然后看下报错的日志。

高难度

强制删除PV和PVC,删除工作负载solo-2,修改错误的yaml文件字段,

solo-2再启动的时候还是提示挂载卷失败

解决方案:将PV和PVC中的错误字段修改正确,然后删除solo中的pod让其自动创建新的pod就可以正常启动

故障点4

solo-3工作负载启动失败

1.solo-3提示:java: no found;分析ConfigMap删除了,可能是环境变量丢失或环境变量被修改。

2.solo-3提示连接数据失败提示:Chek tables faild;分析可能是将secret密钥删除或修改。

解决方案:修改正确的ConfigMap和Secret参数即可

相关推荐
想学后端的前端工程师6 分钟前
【补充内外网突然不通的情况】
运维·服务器
面汤放盐10 分钟前
何时使用以及何时不应使用微服务:没有银弹
java·运维·云计算
子琦啊32 分钟前
【算法复习】字符串 | 两个底层直觉,吃透高频题
linux·运维·算法
AOwhisky1 小时前
Kubernetes 学习笔记:集群管理、命名空间与 Pod 基础
linux·运维·笔记·学习·云原生·kubernetes
小龙在慢慢变强..2 小时前
目录结构(FHS 标准)
linux·运维·服务器
2035去旅行2 小时前
嵌入式开发,如何选择C标准库
linux·arm开发
刘延林.2 小时前
win11系统下通过 WSL2 安装Ubuntu 24.04 使用RTX 5080 GPU
linux·运维·ubuntu
星恒讯工业路由器2 小时前
星恒讯工业生产自动化解决方案
运维·物联网·自动化·智能路由器·信息与通信
a8a3023 小时前
Laravel9.x新特性全解析
运维·spring boot·nginx