大数据-之LibrA数据库系统告警处理(ALM-12051 磁盘Inode使用率超过阈值)

告警解释

系统每30秒周期性检测磁盘Inode使用率,并把实际Inode使用率和阈值(系统默认阈值80%)进行比较,当检测到Inode使用率连续多次(默认值为5)超过阈值时产生该告警。

用户可通过"系统设置 > 阈值配置 > 设备 > 主机 > 磁盘 > 磁盘inode使用率 > 磁盘inode使用率"修改阈值。

平滑次数为1,磁盘Inode使用率小于或等于阈值时,告警恢复;平滑次数大于1,磁盘Inode使用率小于或等于阈值的90%时,告警恢复。

告警属性
告警ID 告警级别 可自动清除
12051 严重
告警参数
参数名称 参数含义
ServiceName 产生告警的服务名称。
RoleName 产生告警的角色名称。
HostName 产生告警的主机名。
PartitionName 产生告警的磁盘分区。
Trigger Condition 系统当前指标取值满足自定义的告警设置条件。
对系统的影响

文件系统无法正常写入。

可能原因
  • 磁盘小文件过多。
  • 系统环境异常。
处理步骤

磁盘小文件过多。

  1. 打开FusionInsight Manager页面,在实时告警列表中,单击此告警。在"告警详情"区域,获取告警所在主机地址和磁盘分区。

  2. 使用PuTTY工具,以root用户登录告警所在主机。

  3. 执行命令df -i | grep -iE " 分区名称| Filesystem",查看磁盘当前Inode使用率。

    复制代码
  4. 若Inode使用率超过阈值,手工排查该分区存在的小文件,确认是否能够删除这些文件。

    说明:

    可使用命令for i in /*; do echo $i; find $i|wc -l; done查看分区下的文件个数,使用时请替换"/*"为需要检查的分区。

    复制代码
    • 是,删除文件,执行[步骤 5](#步骤 5)。
    • 否,参考《容量调整指导书》进行容量调整。执行[步骤 5](#步骤 5)。
  5. 等待5分钟,检查该告警是否恢复。

    • 是,处理完毕。
    • 否,执行[步骤 6](#步骤 6)。

检查系统环境是否异常。

  1. 联系操作系统维护人员,检查操作系统是否存在异常。

    • 是,恢复操作系统故障,执行[步骤 7](#步骤 7)。
    • 否,执行[步骤 8](#步骤 8)。
  2. 等待5分钟,检查该告警是否恢复。

    • 是,处理完毕。
    • 否,执行[步骤 8](#步骤 8)。

收集故障信息。

  1. 在主集群的FusionInsight Manager界面,单击"系统设置 > 日志下载"。
  2. 在"服务"下拉框中勾选"Manager",单击"确定"。
  3. 设置"主机"为告警所在节点和主OMS节点。
  4. 设置日志收集的"开始时间"和"结束时间"分别为告警产生时间的前后30分钟,单击"下载"。
相关推荐
阿里云云原生1 小时前
山石网科×阿里云通义灵码,开启研发“AI智造”新时代
网络·人工智能·阿里云·ai程序员·ai程序员体验官
夜泉_ly1 小时前
MySQL -安装与初识
数据库·mysql
qq_529835352 小时前
对计算机中缓存的理解和使用Redis作为缓存
数据库·redis·缓存
月光水岸New5 小时前
Ubuntu 中建的mysql数据库使用Navicat for MySQL连接不上
数据库·mysql·ubuntu
狄加山6755 小时前
数据库基础1
数据库
我爱松子鱼5 小时前
mysql之规则优化器RBO
数据库·mysql
chengooooooo5 小时前
苍穹外卖day8 地址上传 用户下单 订单支付
java·服务器·数据库
Rverdoser6 小时前
【SQL】多表查询案例
数据库·sql
Galeoto6 小时前
how to export a table in sqlite, and import into another
数据库·sqlite
人间打气筒(Ada)7 小时前
MySQL主从架构
服务器·数据库·mysql