大数据-之LibrA数据库系统告警处理(ALM-12041 关键文件权限异常)

告警解释

系统每隔一个小时检查一次系统中关键目录或者文件权限、用户、用户组是否正常,如果不正常,则上报故障告警。

当检查到权限等均正常,则告警恢复。

告警属性
告警ID 告警级别 可自动清除
12041 严重
告警参数
参数名称 参数含义
ServiceName 产生告警的服务名称。
RoleName 产生告警的角色名称。
HostName 产生告警的主机名。
PathName 异常的文件路径或者名称。
对系统的影响

导致系统功能不可用。

可能原因

用户手动修改了文件权限、用户和用户组等信息或者系统异常下电等原因。

处理步骤

检查异常文件权限。

  1. 在FusionInsight Manager界面,单击"告警管理"。

  2. 查看该告警的详细信息,查看定位信息中对应的"HostName"字段值,获取该告警产生的主机名,查看定位信息中对应的"PathName"字段值,获取异常的文件路径或者名称。

  3. 使用PuTTY工具,以root用户登录告警所在节点。

  4. 执行ll pathName 命令,其中pathName为前面获取到的异常文件,获取到该文件或者目录在主机上的当前的用户,权限,用户组等信息。

  5. 进入"${BIGDATA_HOME}/om-agent/nodeagent/etc/agent/autocheck"目录,然后执行vi keyfile 命令,并搜索对应的异常文件名,可以看到该文件的正确权限。

    说明:

    除keyfile中所列出的文件和目录外,为保证主备OMS配置同步正常,$OMS_RUN_PATH/workspace/ha/module/hasync/plugin/conf/filesync.xml中配置的文件、目录以及目录下的文件和子目录也会被监控,其中文件要求omm用户具有可读写权限,目录要求omm用户具有可读和可执行权限。

  6. 对比当前主机上该文件的真实权限和[步骤 5](#步骤 5)中获取到的文件应有权限,对该文件进行正确的权限和用户,用户组信息的修改。

  7. 等待一个小时,进入下一次检查,查看告警是否恢复。

    • 是,操作结束。

    • 否,执行[步骤 8](#步骤 8)。 说明:

      如果FusionInsight安装目录所在磁盘分区已满,部分程序安装目录会由于sed命令执行失败,产生一些临时文件,且没有读写可执行权限。如果这些文件产生在该告警的监控范围内,那么系统会上报该告警,告警原因可以看到是由于产生的临时文件权限异常导致,可以参照上述告警处理流程处理该告警,或者确认权限异常文件为临时文件后,可以直接删除。sed命令产生的临时文件类似于下图。

收集故障信息。

  1. 在FusionInsight Manager界面,单击"系统设置 > 日志下载"。
  2. 在"服务"下拉框中勾选"NodeAgent",单击"确定"。
  3. 设置日志收集的"开始时间"和"结束时间"分别为告警产生时间的前后10分钟,单击"下载"。
相关推荐
win x36 分钟前
Redis 使用~如何在Java中连接使用redis
java·数据库·redis
ACP广源盛139246256731 小时前
破局 Type‑C 切换器痛点@ACP#GSV6155+LH3828/GSV2221+LH3828 黄金方案
c语言·开发语言·网络·人工智能·嵌入式硬件·计算机外设·电脑
迷枫7121 小时前
DM8 数据库安装实战:从零搭建达梦数据库环境(附全套工具链接)
数据库
Me4神秘2 小时前
国家级互联网骨干直联点及容量、互联网交换中心
大数据·信息与通信
XDHCOM2 小时前
PostgreSQL 25001: active_sql_transaction 报错原因分析,故障修复步骤详解,远程处理解决方案
数据库·sql·postgresql
嵌入式小企鹅2 小时前
蓝牙学习系列(八):BLE L2CAP 协议详解
网络·学习·蓝牙·ble·协议栈·l2cap
卤炖阑尾炎2 小时前
PostgreSQL 日常运维全指南:从基础操作到备份恢复
运维·数据库·postgresql
zandy10113 小时前
全链路可控+极致性能,衡石HENGSHI CLI重新定义企业级BI工具的AI协作能力
大数据·人工智能·ai analytics·ai native·agent-first
广州灵眸科技有限公司3 小时前
为RK3588注入澎湃算力:RK1820 AI加速卡完整适配与评测指南
linux·网络·人工智能·物联网·算法
daad7774 小时前
wifi_note
运维·服务器·数据库