大数据之LibrA数据库系统告警处理(ALM-12014 设备分区丢失)

告警解释

系统周期性进行扫描,如果检测到挂载服务目录的设备分区丢失(如由于设备拔出、设备离线、删除分区等原因)时,产生此告警。

此告警需要手动恢复。

告警属性
告警ID 告警级别 可自动清除
12014 严重
告警参数
参数名称 参数含义
ServiceName 产生告警的服务名称。
RoleName 产生告警的角色名称。
HostName 产生告警的主机名。
DirName 产生告警的挂载目录名。
PartitionName 产生告警的设备分区名。
对系统的影响

造成服务数据无法写入,业务系统运行不正常。

可能原因
  • 硬盘被拔出。
  • 硬盘离线、硬盘坏道等故障。
处理步骤
  1. 打开FusionInsight Manager页面,单击"告警管理",在实时告警列表中,单击此告警所在行。

  2. 在"告警详情"区域,从"定位信息"中获取"HostName"、"PartitionName"和"DirName"。

  3. 确认"HostName"节点的"PartitionName"对应的磁盘是否在对应服务器的插槽上。

    • 是,执行[步骤 4](#步骤 4)。
    • 否,执行[步骤 5](#步骤 5)。
  4. 联系硬件工程师将故障磁盘在线拔出。

  5. 使用PuTTY工具登录发生告警的"HostName"节点,检查"/etc/fstab"文件中是否包含"DirName"的行。

    • 是,执行[步骤 6](#步骤 6)。
    • 否,执行[步骤 7](#步骤 7)。
  6. 执行vi /etc/fstab命令编辑文件,将包含"DirName"的行删除。

  7. 联系硬件工程师插入全新磁盘,具体操作请参考对应型号的硬件产品文档,如果原来故障的磁盘是RAID,那么请按照对应RAID卡的配置方法配置RAID。

  8. 等待20~30分钟后执行mount 命令(具体时间依赖磁盘的大小),检查磁盘是否已经挂载在目录"DirName"上。

    • 是,手动清除该告警,操作结束。
    • 否,执行[步骤 9](#步骤 9)。
相关推荐
weixin_5498083622 分钟前
以运营为核心的智能劳动力管理系统,破解连锁零售、制造业排班难题
大数据·人工智能·零售
八股文领域大手子1 小时前
深入理解缓存淘汰策略:LRU 与 LFU 算法详解及 Java 实现
java·数据库·算法·缓存·mybatis·哈希算法
noravinsc1 小时前
django admin 中更新表数据 之后再将数据返回管理界面
数据库·django·sqlite
SunTecTec2 小时前
Flink Docker Application Mode 命令解析 - 修改命令以启用 Web UI
大数据·前端·docker·flink
喜欢猪猪3 小时前
系统架构师---基于规则的系统架构
大数据·elasticsearch·搜索引擎
2401_871290583 小时前
如何在idea中写spark程序
大数据·spark·intellij-idea
Bruce-li__3 小时前
DRF凭什么更高效?Django原生API与DRF框架开发对比解析
数据库·django·sqlite
三块钱07943 小时前
【原创】从s3桶将对象导入ES建立索引,以便快速查找文件
大数据·elasticsearch·搜索引擎·s3
noravinsc4 小时前
connection.cursor() 与 models.objects.filter
数据库·django·原生查询·orm查询
拓端研究室TRL5 小时前
PyMC+AI提示词贝叶斯项目反应IRT理论Rasch分析篮球比赛官方数据:球员能力与位置层级结构研究
大数据·人工智能·python·算法·机器学习