大数据之LibrA数据库系统告警处理(ALM-12002 HA资源异常)

告警解释

HA软件周期性检测Manager的WebService浮动IP地址和数据库。当HA软件检测到浮动IP地址或数据库异常时,产生该告警。

当HA检测到浮动IP地址或数据库正常后,告警恢复。

告警属性
告警参数
对系统的影响

如果Manager的WebService浮动IP地址异常,用户无法登录和使用FusionInsight Manager。如果数据库异常,所有核心业务和相关业务进程,例如告警和监控功能,都会受影响。

可能原因
  • 浮动IP地址异常。
  • 数据库异常。
处理步骤

检查主管理节点的浮动IP地址状态。

  1. 打开FusionInsight Manager页面,在告警列表中,单击此告警所在行,在告警详情中,查看该告警的主机地址及资源名称。

  2. 使用PuTTY工具,以root用户登录主管理节点。

  3. 进入"${BIGDATA_HOME}/om-server/om/sbin/"目录,并执行status-oms.sh 脚本检查主Manager的浮动IP是否正常, 查看回显中,主管理节点的"ResName"为"floatip"的一行,是否显示以下信息:

    例如:

    复制代码
    10-10-10-160   floatip  Normal  Normal   Single_active
    • 是,执行[步骤 7](#步骤 7)。
    • 否,执行[步骤 4](#步骤 4)。
  4. 执行ifconfig 命令检查浮动IP地址的网卡是否存在。

    • 是,执行[步骤 7](#步骤 7)。
    • 否,执行[步骤 5](#步骤 5)。
  5. 执行命令ifconfig 网卡名称 浮动IP 地址 netmask 子网掩码 重新配置浮动IP网卡(例如,ifconfig eth0 10.10.10.102 netmask 255.255.255.0)。

  6. 等待5分钟,查看告警列表中,该告警是否已清除。

    • 是,处理完毕。
    • 否,执行[步骤 7](#步骤 7)。

    检查主备管理节点的数据库状态。

  7. 分别登录主备管理节点,执行su - ommdba 命令切换到ommdba 用户,执行gs_ctl query 命令。查看回显是否显示以下信息。

    主管理节点的回显:

    复制代码
     Ha state: 
            LOCAL_ROLE                    : Primary 
            STATIC_CONNECTIONS            : 1 
            DB_STATE                      : Normal 
            DETAIL_INFORMATION            : user/password invalid 
     Senders info: 
            No information 
     Receiver info: 
            No information     

    备管理节点的回显:

    复制代码
     Ha state: 
            LOCAL_ROLE                    : Standby 
            STATIC_CONNECTIONS            : 1 
            DB_STATE                      : Normal 
            DETAIL_INFORMATION            : user/password invalid 
     Senders info: 
            No information 
     Receiver info: 
            No information
    • 是,执行[步骤 9](#步骤 9)。
    • 否,执行[步骤 8](#步骤 8)。
  8. 联系网络管理员查看是否为网络故障,并修复故障。

    • 是,执行[步骤 9](#步骤 9)。
    • 否,执行[步骤 11](#步骤 11)。
  9. 等待5分钟,查看告警列表中,该告警是否已清除。

    • 是,处理完毕。
    • 否,执行[步骤 10](#步骤 10)。
  10. 分别登录主备管理节点,执行su - omm 命令切换到omm, 用户进入"${BIGDATA_HOME}/om-server/om/sbin/"目录,并执行status-oms.sh 脚本检查主备Manager的浮动IP资源和高斯db资源是否如下图所示的状态:

收集故障信息。

  1. 在FusionInsight Manager界面,单击"系统设置 > 日志下载"。
  2. 在"服务"下拉框中勾选"OmmServer",单击"确定"。
  3. 设置日志收集的"开始时间"和"结束时间"分别为告警产生时间的前后10分钟,单击"下载"。
相关推荐
码农小卡拉19 分钟前
深入解析Spring Boot文件加载顺序与加载方式
java·数据库·spring boot
怣5023 分钟前
MySQL多表连接:全外连接、交叉连接与结果集合并详解
数据库·sql
wjhx44 分钟前
QT中对蓝牙权限的申请,整理一下
java·数据库·qt
冰暮流星1 小时前
javascript之二重循环练习
开发语言·javascript·数据库
万岳科技系统开发1 小时前
食堂采购系统源码库存扣减算法与并发控制实现详解
java·前端·数据库·算法
冉冰学姐2 小时前
SSM智慧社区管理系统jby69(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面
数据库·管理系统·智慧社区·ssm 框架
杨超越luckly2 小时前
HTML应用指南:利用GET请求获取中国500强企业名单,揭秘企业增长、分化与转型的新常态
前端·数据库·html·可视化·中国500强
Elastic 中国社区官方博客2 小时前
Elasticsearch:Workflows 介绍 - 9.3
大数据·数据库·人工智能·elasticsearch·ai·全文检索
仍然.2 小时前
MYSQL--- 聚合查询,分组查询和联合查询
数据库
一 乐2 小时前
校园二手交易|基于springboot + vue校园二手交易系统(源码+数据库+文档)
java·数据库·vue.js·spring boot·后端