云计算案例排错(云上4)

故障点1

PV/PVC创建失败

提示:error:error parsing nfs-pv.yaml:error converting YAM to JSON: yaml: line 9: cloud not find expooteec ' : '

解决方案:PV/PVC文件中缺少了 :号,找到缺少的补上即可

故障点2

创建PV和PVC时状态不是bound状态

解决方案:删除pv/pvc,使用命令:kubectl delete pvc nfs-pvc (和kubectl delete pv nfs-pv)

说明:先删除pvc再删除pv,且不能有工作负载(pod)运行。强制删除命令慎用:删除PVC是kubectl delete pvc pvc的名字 --force --grace-period=0;删除PV是 kubectl delete pv pv的名字 --force --grace-period=0 忘记了可以使用kubectl delete -f --help帮助命令去查看

故障点3!(做完复制yaml出来)

solo-2工作负载启动失败

1.solo-2提示找不到volumes启动失败,先提示实例调度失败,再提示实例挂在卷失败 (Unable to attach or mount volmes:unmounted volumes)

分析:可能是对等体或云连接没有了(ping一下99.0.0.100源)

2.solo-2提示:java: no found;分析yaml文件错误

3.提示:Check tables failed;分析soloEIP丢失

4.提示:Check tables failed;分析目标ECS的EIP与dockerfile文件不一致

5.提示:Check tables failed;分析目标ECS安全组入向规则端口缺少

6.提示:Check tables failed;分析solo集群的2个安全组的出方向规则做了修改,远端非any

解决方案:

1.创建对等体和路由或云连接

2.修改正确的yaml文件拿之前做的对比一下

3.solo节点绑定EIP

4.将dockerfile文件中的EIP地址与目标ECS的EIP地址一致

5.目标ECS的安全组中添加正确的端口

6.将solo集群2个安全组的出方向远端改为any

说明:如果solo-2的外部地址已经不可访问了,但是状态还是运行中的,那么手动删除pod后会自动生成然后看下报错的日志。

高难度

强制删除PV和PVC,删除工作负载solo-2,修改错误的yaml文件字段,

solo-2再启动的时候还是提示挂载卷失败

解决方案:将PV和PVC中的错误字段修改正确,然后删除solo中的pod让其自动创建新的pod就可以正常启动

故障点4

solo-3工作负载启动失败

1.solo-3提示:java: no found;分析ConfigMap删除了,可能是环境变量丢失或环境变量被修改。

2.solo-3提示连接数据失败提示:Chek tables faild;分析可能是将secret密钥删除或修改。

解决方案:修改正确的ConfigMap和Secret参数即可

相关推荐
女神下凡几秒前
轻量应用服务器 与 云服务器ECS 区别
运维·服务器
实在智能RPA1 分钟前
培训Agent如何根据岗位自动发放计划?——2026企业级智能自动化实战指南
运维·服务器·人工智能·ai·自动化
Database_Cool_3 分钟前
PB 级数据实时分析:阿里云 AnalyticDB MySQL Serverless 弹性架构深度解析
阿里云·架构·云计算
syagain_zsx11 分钟前
Linux进程控制学习总结(1/2)
linux·运维·学习
Maker 张12 分钟前
树莓派上传温湿度模拟数据到腾讯云物联网平台
物联网·云计算·腾讯云
晨晖216 分钟前
linux命令12(shell编程)
linux·运维·服务器
雨打夏夜18 分钟前
VMware + CentOS 9 双网卡静态 IP 配置完整指南
linux·虚拟机
我叫张小白。19 分钟前
Docker核心命令
运维·docker·容器
承渊政道26 分钟前
【MySQL数据库学习】MySQL基本查询(上)
linux·数据库·学习·mysql·bash·数据库开发·数据库系统
羽翼安全26 分钟前
多摄像头接入检测 + 文件加密:监控室防拍照系统的两道设备与数据防线
运维·网络·人工智能