大数据-之LibrA数据库系统告警处理(ALM-37004 Datanode主备不同步或者断连)

告警解释

当DN主实例与DN备实例连接异常时,产生该告警。

告警属性
告警ID 告警级别 可自动清除
37004 严重
告警参数
参数名称 参数含义
ServiceName 产生告警的服务名称
RoleName 产生告警的角色名称
HostName 产生告警的主机名
Instance 产生告警的实例
对系统的影响

DN主实例的Redo日志将自动发送到对应的DN从备实例,会增加该DN从备实例所在物理节点上的网络压力。

系统自处理过程

当DN主实例与对应的DN备实例连接异常时,DN主实例的Redo日志将自动发送到对应的DN从备实例,不影响业务的运行。

可能原因

DN主实例与对应的DN备实例连接异常。

处理步骤

查看告警原因。

  1. 执行如下命令查看集群DN主备实例是否故障。

    复制代码
    gs_om -t status --detail
    • 是,修复故障实例,具体方法请参考"修复MPPDBServer实例"。
    • 否,执行2
  2. 查看集群DN主备实例所在机器网络是否正常,比如DN主实例所在机器或者备实例所在机器机使用的网卡为eth0,使用下面命令查看网络是否正常。

    复制代码
    /sbin/ifconfig eth0
    • 如果网卡正常,执行3
    • 如果显示网卡不正常,请及时联系硬件工程师修复网卡,再执行3
  3. 查看告警是否仍然存在。

    • 是,执行4
    • 否,处理完毕。

收集故障信息。

  1. 在FusionInsight Manager界面,单击"系统设置 > 日志下载"。
  2. 在"服务"下拉框中勾选"MPPDB",单击"确定"。
  3. 设置日志收集的"开始时间"和"结束时间"分别为告警产生时间的前后1小时,单击"下载"。
相关推荐
NineData3 小时前
NineData 迁移评估功能正式上线
数据库·dba
NineData9 小时前
数据库迁移总踩坑?用 NineData 迁移评估,提前识别所有兼容性风险
数据库·程序员·云计算
赵渝强老师11 小时前
【赵渝强老师】PostgreSQL中表的碎片
数据库·postgresql
字节跳动数据平台15 小时前
代码量减少 70%、GPU 利用率达 95%:火山引擎多模态数据湖如何释放模思智能的算法生产力
大数据
全栈老石15 小时前
拆解低代码引擎核心:元数据驱动的"万能表"架构
数据库·低代码
得物技术16 小时前
深入剖析Spark UI界面:参数与界面详解|得物技术
大数据·后端·spark
YuMiao17 小时前
gstatic连接问题导致Google Gemini / Studio页面乱码或图标缺失问题
服务器·网络协议
武子康18 小时前
大数据-238 离线数仓 - 广告业务 Hive分析实战:ADS 点击率、购买率与 Top100 排名避坑
大数据·后端·apache hive
倔强的石头_1 天前
kingbase备份与恢复实战(二)—— sys_dump库级逻辑备份与恢复(Windows详细步骤)
数据库
武子康2 天前
大数据-237 离线数仓 - Hive 广告业务实战:ODS→DWD 事件解析、广告明细与转化分析落地
大数据·后端·apache hive