大数据-之LibrA数据库系统告警处理(ALM-37003 GTM主备不同步或者GTM主备断连)

告警解释

当GTM主实例与GTM备实例连接异常或者GTM主实例未处于同步状态时,产生该告警。

告警属性
告警ID 告警级别 可自动清除
37003 严重
告警参数
参数名称 参数含义
ServiceName 产生告警的服务名称
RoleName 产生告警的角色名称
HostName 产生告警的主机名
Instance 产生告警的实例
对系统的影响

当GTM主实例与GTM备实例连接异常时,如果GTM主实例处于同步模式,系统将在120s内不可用,待检测到该故障时,会将GTM主实例设成最高可用模式,系统恢复使用。如果是最高可用模式,系统仍然可以正常使用。

说明:

集群正常运行时,GTM主实例处于同步模式,主实例收到执行任务后会同步任务到备实例,主备实例间实时同步。当备实例故障且无法自动修复后,主实例将停止同步任务到备实例,此时称主实例为最高可用模式。

可能原因

GTM主实例与GTM备实例连接异常。

处理步骤

查看告警原因。

  1. 执行如下命令查看集群GTM主备实例是否故障。

    复制代码
    gs_om -t status --detail
    • 是,修复故障实例,具体方法请参考"修复MPPDBServer实例"章节。
    • 否,执行2
  2. 查看集群GTM主备实例所在机器网络是否正常,比如GTM主实例所在机器或者备实例所在机器机使用的网卡为eth0,使用下面命令查看网络是否正常。

    复制代码
    /sbin/ifconfig eth0
    • 如果网卡正常,执行3
    • 如果显示网卡不正常,请及时联系硬件工程师修复网卡,再执行3
  3. 查看告警是否仍然存在。

    • 是,执行4
    • 否,处理完毕。

收集故障信息。

  1. 在FusionInsight Manager界面,单击"系统设置 > 日志下载"。
  2. 在"服务"下拉框中勾选"MPPDB",单击"确定"。
  3. 设置日志收集的"开始时间"和"结束时间"分别为告警产生时间的前后1小时,单击"下载"。
相关推荐
WeeJot嵌入式3 分钟前
大数据治理:确保数据的可持续性和价值
大数据
。puppy9 分钟前
HCIP--3实验- 链路聚合,VLAN间通讯,Super VLAN,MSTP,VRRPip配置,OSPF(静态路由,环回,缺省,空接口),NAT
运维·服务器
颇有几分姿色19 分钟前
深入理解 Linux 内存管理:free 命令详解
linux·运维·服务器
zmd-zk1 小时前
kafka+zookeeper的搭建
大数据·分布式·zookeeper·中间件·kafka
激流丶1 小时前
【Kafka 实战】如何解决Kafka Topic数量过多带来的性能问题?
java·大数据·kafka·topic
EricWang13581 小时前
[OS] 项目三-2-proc.c: exit(int status)
服务器·c语言·前端
测试界的酸菜鱼1 小时前
Python 大数据展示屏实例
大数据·开发语言·python
时差9531 小时前
【面试题】Hive 查询:如何查找用户连续三天登录的记录
大数据·数据库·hive·sql·面试·database
让学习成为一种生活方式1 小时前
R包下载太慢安装中止的解决策略-R语言003
java·数据库·r语言
Mephisto.java1 小时前
【大数据学习 | kafka高级部分】kafka中的选举机制
大数据·学习·kafka