大数据-之LibrA数据库系统告警处理(ALM-37014 Gaussdb进程锁文件已经存在)

告警解释

当集群中的CN实例或者DN实例锁文件创建失败时,产生该告警。

告警属性
告警ID 告警级别 可自动清除
37014 严重
告警参数
参数名称 参数含义
ServiceName 产生告警的服务名称
RoleName 产生告警的角色名称
HostName 产生告警的主机名
Instance 产生告警的实例
对系统的影响

发生数据库锁文件创建失败时,锁文件创建失败的实例可能无法启动,集群将无法正常启动。

可能原因

系统数据实例异常终止,导致系统中存在锁文件残留。

处理步骤
  1. 使用omm用户登录告警上报的节点。
  2. 初始化环境变量。 source ${BIGDATA_HOME}/mppdb/.mppdbgs_profile
  1. 执行如下命令获取出现告警的主机和数据实例的数据目录。(如下主机为10.252.153.218,数据目录为/srv/BigData/mppdb/data1/coordinator)

    复制代码
  2. 使用SSH方式登录上述主机,执行如下命令进入目录并检查是否存在postmaster.pid文件。

    复制代码
    • 是,执行5
    • 否,执行8
  3. 执行如下命令获取postmaster.pid文件中第一行的pid。

    复制代码
  4. 执行如下命令查看上述pid对应的进程是否存在。

    复制代码
    ps -ef |grep 42883
    复制代码
    omm       42883      1  4 Nov05 ?        17:25:59 /opt/huawei/Bigdata/mppdb/core/bin/gaussdb --coordinator -D /srv/BigData/mppdb/data1/coordinator
    omm      125791  55322  0 15:10 pts/0    00:00:00 grep --color=auto 42883
    • 是,执行7
    • 否,执行8
  5. 执行如下命令终止上述进程,并删除postmaster.pid文件后查看告警是否恢复。

    复制代码
    • 是,处理完毕。
    • 否,执行8
  6. 在FusionInsight Manager界面,单击"系统设置 > 日志下载"。

  7. 在"服务"下拉框中勾选"MPPDB",单击"确定"。

  8. 设置日志收集的"开始时间"和"结束时间"分别为告警产生时间的前后1小时,单击"下载"。

相关推荐
大数据CLUB2 小时前
基于spark的澳洲光伏发电站选址预测
大数据·hadoop·分布式·数据分析·spark·数据开发
MarkHard1232 小时前
如何利用redis使用一个滑动窗口限流
数据库·redis·缓存
ratbag6720132 小时前
当环保遇上大数据:生态环境大数据技术专业的课程侧重哪些领域?
大数据
island13144 小时前
【Redis#10】渐进式遍历 | 数据库管理 | redis_cli | RES
数据库·redis·bootstrap
心想事成的幸运大王4 小时前
Redis的过期策略
数据库·redis·缓存
倔强的石头_4 小时前
CentOS 上安装KingbaseES(ISO包)详细教程
数据库
计算机编程小央姐4 小时前
跟上大数据时代步伐:食物营养数据可视化分析系统技术前沿解析
大数据·hadoop·信息可视化·spark·django·课程设计·食物
2401_897930064 小时前
使用Docker轻松部署Neo4j图数据库
数据库·docker·neo4j
诗句藏于尽头5 小时前
Django模型与数据库表映射的两种方式
数据库·python·django
智数研析社5 小时前
9120 部 TMDb 高分电影数据集 | 7 列全维度指标 (评分 / 热度 / 剧情)+API 权威源 | 电影趋势分析 / 推荐系统 / NLP 建模用
大数据·人工智能·python·深度学习·数据分析·数据集·数据清洗