大数据-之LibrA数据库系统告警处理(ALM-37003 GTM主备不同步或者GTM主备断连)

告警解释

当GTM主实例与GTM备实例连接异常或者GTM主实例未处于同步状态时,产生该告警。

告警属性
告警ID 告警级别 可自动清除
37003 严重
告警参数
参数名称 参数含义
ServiceName 产生告警的服务名称
RoleName 产生告警的角色名称
HostName 产生告警的主机名
Instance 产生告警的实例
对系统的影响

当GTM主实例与GTM备实例连接异常时,如果GTM主实例处于同步模式,系统将在120s内不可用,待检测到该故障时,会将GTM主实例设成最高可用模式,系统恢复使用。如果是最高可用模式,系统仍然可以正常使用。

说明:

集群正常运行时,GTM主实例处于同步模式,主实例收到执行任务后会同步任务到备实例,主备实例间实时同步。当备实例故障且无法自动修复后,主实例将停止同步任务到备实例,此时称主实例为最高可用模式。

可能原因

GTM主实例与GTM备实例连接异常。

处理步骤

查看告警原因。

  1. 执行如下命令查看集群GTM主备实例是否故障。

    复制代码
    gs_om -t status --detail
    • 是,修复故障实例,具体方法请参考"修复MPPDBServer实例"章节。
    • 否,执行2
  2. 查看集群GTM主备实例所在机器网络是否正常,比如GTM主实例所在机器或者备实例所在机器机使用的网卡为eth0,使用下面命令查看网络是否正常。

    复制代码
    /sbin/ifconfig eth0
    • 如果网卡正常,执行3
    • 如果显示网卡不正常,请及时联系硬件工程师修复网卡,再执行3
  3. 查看告警是否仍然存在。

    • 是,执行4
    • 否,处理完毕。

收集故障信息。

  1. 在FusionInsight Manager界面,单击"系统设置 > 日志下载"。
  2. 在"服务"下拉框中勾选"MPPDB",单击"确定"。
  3. 设置日志收集的"开始时间"和"结束时间"分别为告警产生时间的前后1小时,单击"下载"。
相关推荐
李广坤21 小时前
MySQL 大表字段变更实践(改名 + 改类型 + 改长度)
数据库
Sinclair21 小时前
简单几步,安卓手机秒变服务器,安装 CMS 程序
android·服务器
武子康1 天前
大数据-236 离线数仓 - 会员指标验证、DataX 导出与广告业务 ODS/DWD/ADS 全流程
大数据·后端·apache hive
Rockbean2 天前
用40行代码搭建自己的无服务器OCR
服务器·python·deepseek
爱可生开源社区2 天前
2026 年,优秀的 DBA 需要具备哪些素质?
数据库·人工智能·dba
茶杯梦轩2 天前
CompletableFuture 在 项目实战 中 创建异步任务 的核心优势及使用场景
服务器·后端·面试
随逸1772 天前
《从零搭建NestJS项目》
数据库·typescript
武子康2 天前
大数据-235 离线数仓 - 实战:Flume+HDFS+Hive 搭建 ODS/DWD/DWS/ADS 会员分析链路
大数据·后端·apache hive
海天鹰3 天前
【免费】PHP主机=域名+解析+主机
服务器
DianSan_ERP3 天前
电商API接口全链路监控:构建坚不可摧的线上运维防线
大数据·运维·网络·人工智能·git·servlet