告警解释
HA软件周期性检测Manager的WebService浮动IP地址和数据库。当HA软件检测到浮动IP地址或数据库异常时,产生该告警。
当HA检测到浮动IP地址或数据库正常后,告警恢复。
告警属性
告警参数
对系统的影响
如果Manager的WebService浮动IP地址异常,用户无法登录和使用FusionInsight Manager。如果数据库异常,所有核心业务和相关业务进程,例如告警和监控功能,都会受影响。
可能原因
- 浮动IP地址异常。
- 数据库异常。
处理步骤
检查主管理节点的浮动IP地址状态。
-
打开FusionInsight Manager页面,在告警列表中,单击此告警所在行,在告警详情中,查看该告警的主机地址及资源名称。
-
使用PuTTY工具,以root用户登录主管理节点。
-
进入"${BIGDATA_HOME}/om-server/om/sbin/"目录,并执行status-oms.sh 脚本检查主Manager的浮动IP是否正常, 查看回显中,主管理节点的"ResName"为"floatip"的一行,是否显示以下信息:
例如:
10-10-10-160 floatip Normal Normal Single_active
- 是,执行[步骤 7](#步骤 7)。
- 否,执行[步骤 4](#步骤 4)。
-
执行ifconfig 命令检查浮动IP地址的网卡是否存在。
- 是,执行[步骤 7](#步骤 7)。
- 否,执行[步骤 5](#步骤 5)。
-
执行命令ifconfig 网卡名称 浮动IP 地址 netmask 子网掩码 重新配置浮动IP网卡(例如,ifconfig eth0 10.10.10.102 netmask 255.255.255.0)。
-
等待5分钟,查看告警列表中,该告警是否已清除。
- 是,处理完毕。
- 否,执行[步骤 7](#步骤 7)。
检查主备管理节点的数据库状态。
-
分别登录主备管理节点,执行su - ommdba 命令切换到ommdba 用户,执行gs_ctl query 命令。查看回显是否显示以下信息。
主管理节点的回显:
Ha state: LOCAL_ROLE : Primary STATIC_CONNECTIONS : 1 DB_STATE : Normal DETAIL_INFORMATION : user/password invalid Senders info: No information Receiver info: No information
备管理节点的回显:
Ha state: LOCAL_ROLE : Standby STATIC_CONNECTIONS : 1 DB_STATE : Normal DETAIL_INFORMATION : user/password invalid Senders info: No information Receiver info: No information
- 是,执行[步骤 9](#步骤 9)。
- 否,执行[步骤 8](#步骤 8)。
-
联系网络管理员查看是否为网络故障,并修复故障。
- 是,执行[步骤 9](#步骤 9)。
- 否,执行[步骤 11](#步骤 11)。
-
等待5分钟,查看告警列表中,该告警是否已清除。
- 是,处理完毕。
- 否,执行[步骤 10](#步骤 10)。
-
分别登录主备管理节点,执行su - omm 命令切换到omm, 用户进入"${BIGDATA_HOME}/om-server/om/sbin/"目录,并执行status-oms.sh 脚本检查主备Manager的浮动IP资源和高斯db资源是否如下图所示的状态:
收集故障信息。
- 在FusionInsight Manager界面,单击"系统设置 > 日志下载"。
- 在"服务"下拉框中勾选"OmmServer",单击"确定"。
- 设置日志收集的"开始时间"和"结束时间"分别为告警产生时间的前后10分钟,单击"下载"。