大数据-之LibrA数据库系统告警处理（ALM-12051 磁盘Inode使用率超过阈值）

红烧小肥杨2023-11-20 23:40

告警解释

系统每30秒周期性检测磁盘Inode使用率，并把实际Inode使用率和阈值（系统默认阈值80%）进行比较，当检测到Inode使用率连续多次（默认值为5）超过阈值时产生该告警。

用户可通过"系统设置 > 阈值配置 > 设备 > 主机 > 磁盘 > 磁盘inode使用率 > 磁盘inode使用率"修改阈值。

平滑次数为1，磁盘Inode使用率小于或等于阈值时，告警恢复；平滑次数大于1，磁盘Inode使用率小于或等于阈值的90%时，告警恢复。

告警属性

告警ID	告警级别	可自动清除
12051	严重	是

告警参数

参数名称	参数含义
ServiceName	产生告警的服务名称。
RoleName	产生告警的角色名称。
HostName	产生告警的主机名。
PartitionName	产生告警的磁盘分区。
Trigger Condition	系统当前指标取值满足自定义的告警设置条件。

对系统的影响

文件系统无法正常写入。

可能原因

磁盘小文件过多。
系统环境异常。

处理步骤

磁盘小文件过多。

打开FusionInsight Manager页面，在实时告警列表中，单击此告警。在"告警详情"区域，获取告警所在主机地址和磁盘分区。
使用PuTTY工具，以root用户登录告警所在主机。
执行命令df -i | grep -iE " 分区名称| Filesystem"，查看磁盘当前Inode使用率。
复制代码
若Inode使用率超过阈值，手工排查该分区存在的小文件，确认是否能够删除这些文件。

说明：

可使用命令for i in /*; do echo $i; find$ i|wc -l; done查看分区下的文件个数，使用时请替换"/*"为需要检查的分区。
复制代码
- 是，删除文件，执行[步骤 5](#步骤 5)。
- 否，参考《容量调整指导书》进行容量调整。执行[步骤 5](#步骤 5)。
等待5分钟，检查该告警是否恢复。
- 是，处理完毕。
- 否，执行[步骤 6](#步骤 6)。

检查系统环境是否异常。

联系操作系统维护人员，检查操作系统是否存在异常。
- 是，恢复操作系统故障，执行[步骤 7](#步骤 7)。
- 否，执行[步骤 8](#步骤 8)。
等待5分钟，检查该告警是否恢复。
- 是，处理完毕。
- 否，执行[步骤 8](#步骤 8)。

收集故障信息。

在主集群的FusionInsight Manager界面，单击"系统设置 > 日志下载"。
在"服务"下拉框中勾选"Manager"，单击"确定"。
设置"主机"为告警所在节点和主OMS节点。
设置日志收集的"开始时间"和"结束时间"分别为告警产生时间的前后30分钟，单击"下载"。

上一篇：vertx学习

下一篇：Prompt提示词——什么是CRISPE框架？QCIPSPE框架？

热门推荐

01GitHub 镜像站点 02AI科技热点日报 | 2026年07月01日 03幻兽帕鲁 - 服务器管理员权限与 GM 命令完全指南 042026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 05GPT-5.5 对比 GPT-5.6 Sol、Terra、Luna：官方性能数据与选型分析 062026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？07AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 082026 年 AI 编程工具终极横评：Cursor vs Claude Code vs Copilot vs Windsurf 092026 AI 编程工具终极实战指南：Cursor vs Claude Code vs Copilot，开发者该怎么选？102026 年 AI 大模型 & AI 编程工具实战全总结