大数据-之LibrA数据库系统告警处理(ALM-12047 网络读包错误率超过阈值)

告警解释

系统每30秒周期性检测网络读包错误率,并把实际错误率和阈值(系统默认阈值0.5%)进行比较,当检测到网络读包错误率连续多次(默认值为5)超过阈值时产生该告警。

用户可通过"系统设置 > 阈值配置 > 设备 > 主机 > 网络读信息 > 网络读包率信息 > 读包错误率"修改阈值。

平滑次数为1,网络读包错误率小于或等于阈值时,告警恢复;平滑次数大于1,网络读包错误率小于或等于阈值的90%时,告警恢复。

告警属性
告警ID 告警级别 可自动清除
12047 严重
告警参数
参数名称 参数含义
ServiceName 产生告警的服务名称。
RoleName 产生告警的角色名称。
HostName 产生告警的主机名。
NetworkCardName 产生告警的网口名。
Trigger Condition 系统当前指标取值满足自定义的告警设置条件。
对系统的影响

通信闪断,业务超时。

可能原因
  • 告警阈值配置不合理。
  • 网络环境异常。
处理步骤

检查阈值设置是否合理。

  1. 登录FusionInsight Manager,查看该告警阈值是否合理(默认0.5%为合理值,用户可以根据自己的实际需求调节)。

    • 是,执行[步骤 4](#步骤 4)。
    • 否,执行[步骤 2](#步骤 2)。
  2. 根据实际服务的使用情况在"系统设置 > 阈值配置 > 设备 > 主机 > 网络读信息 > 网络读包率信息 > 读包错误率"中更改告警阈值。

    图1所示

    图1设置告警阈值

  3. 等待5分钟,检查该告警是否恢复。

    • 是,处理完毕。
    • 否,执行[步骤 4](#步骤 4)。

检查网络是否异常。

  1. 联系系统管理员,检查网络是否存在异常。

    • 是,恢复网络故障,执行[步骤 5](#步骤 5)。
    • 否,执行[步骤 6](#步骤 6)。
  2. 等待5分钟,检查该告警是否恢复。

    • 是,处理完毕。
    • 否,执行[步骤 6](#步骤 6)。

收集故障信息。

  1. 在主集群的FusionInsight Manager界面,单击"系统设置 > 日志下载"。
  2. 在"服务"下拉框中勾选"Manager",单击"确定"。
  3. 设置"主机"为告警所在节点和主OMS节点。
  4. 设置日志收集的"开始时间"和"结束时间"分别为告警产生时间的前后30分钟,单击"下载"。
相关推荐
“αβ”6 小时前
MySQL表的操作
linux·网络·数据库·c++·网络协议·mysql·https
p***s916 小时前
Spring数据库原理 之 DataSource
java·数据库·spring
虹科网络安全6 小时前
艾体宝干货 | Redis Java 开发系列#1 从零开始的环境搭建与实践指南
java·数据库·redis
火山引擎开发者社区6 小时前
火山引擎向量数据库 Milvus 版正式商业化:AI 时代的向量检索新标杆
数据库·milvus·火山引擎
十五年专注C++开发6 小时前
Asio2: 一个基于 Boost.Asio 封装的高性能网络编程库
网络·c++·boost·asio·asio2
神秘的土鸡7 小时前
openEuler 25.09 企业级 MySQL主从复制部署与性能优化实战提升50%
linux·数据库·mysql·性能优化·openeuler
韩立学长7 小时前
基于Springboot课堂教学辅助系统08922bq1(程序、源码、数据库、调试部署方案及开发环境)系统界面展示及获取方式置于文档末尾,可供参考。
数据库·spring boot·后端
牛奶咖啡137 小时前
解决配置虚拟网络后同网段的设备网络不通问题
网络·桥接模式·主机模式·配置虚拟网络后同网段设备不通·排查解决同网段同网关网络不通·重置windows主机网络·nas模式
元拓数智7 小时前
IntaLink:破解数仓建设痛点,重塑高效建设新范式
大数据·数据仓库·人工智能·数据关系·intalink