故障点1
PV/PVC创建失败
提示:error:error parsing nfs-pv.yaml:error converting YAM to JSON: yaml: line 9: cloud not find expooteec ' : '
解决方案:PV/PVC文件中缺少了 :号,找到缺少的补上即可
故障点2
创建PV和PVC时状态不是bound状态
解决方案:删除pv/pvc,使用命令:kubectl delete pvc nfs-pvc (和kubectl delete pv nfs-pv)
说明:先删除pvc再删除pv,且不能有工作负载(pod)运行。强制删除命令慎用:删除PVC是kubectl delete pvc pvc的名字 --force --grace-period=0;删除PV是 kubectl delete pv pv的名字 --force --grace-period=0 忘记了可以使用kubectl delete -f --help帮助命令去查看
故障点3!(做完复制yaml出来)
solo-2工作负载启动失败
1.solo-2提示找不到volumes启动失败,先提示实例调度失败,再提示实例挂在卷失败 (Unable to attach or mount volmes:unmounted volumes)
分析:可能是对等体或云连接没有了(ping一下99.0.0.100源)
2.solo-2提示:java: no found;分析yaml文件错误
3.提示:Check tables failed;分析soloEIP丢失
4.提示:Check tables failed;分析目标ECS的EIP与dockerfile文件不一致
5.提示:Check tables failed;分析目标ECS安全组入向规则端口缺少
6.提示:Check tables failed;分析solo集群的2个安全组的出方向规则做了修改,远端非any
解决方案:
1.创建对等体和路由或云连接
2.修改正确的yaml文件拿之前做的对比一下
3.solo节点绑定EIP
4.将dockerfile文件中的EIP地址与目标ECS的EIP地址一致
5.目标ECS的安全组中添加正确的端口
6.将solo集群2个安全组的出方向远端改为any
说明:如果solo-2的外部地址已经不可访问了,但是状态还是运行中的,那么手动删除pod后会自动生成然后看下报错的日志。
高难度
强制删除PV和PVC,删除工作负载solo-2,修改错误的yaml文件字段,
solo-2再启动的时候还是提示挂载卷失败
解决方案:将PV和PVC中的错误字段修改正确,然后删除solo中的pod让其自动创建新的pod就可以正常启动
故障点4
solo-3工作负载启动失败
1.solo-3提示:java: no found;分析ConfigMap删除了,可能是环境变量丢失或环境变量被修改。
2.solo-3提示连接数据失败提示:Chek tables faild;分析可能是将secret密钥删除或修改。
解决方案:修改正确的ConfigMap和Secret参数即可