大数据-之LibrA数据库系统告警处理(ALM-37014 Gaussdb进程锁文件已经存在)

告警解释

当集群中的CN实例或者DN实例锁文件创建失败时,产生该告警。

告警属性
告警ID 告警级别 可自动清除
37014 严重
告警参数
参数名称 参数含义
ServiceName 产生告警的服务名称
RoleName 产生告警的角色名称
HostName 产生告警的主机名
Instance 产生告警的实例
对系统的影响

发生数据库锁文件创建失败时,锁文件创建失败的实例可能无法启动,集群将无法正常启动。

可能原因

系统数据实例异常终止,导致系统中存在锁文件残留。

处理步骤
  1. 使用omm用户登录告警上报的节点。
  2. 初始化环境变量。 source ${BIGDATA_HOME}/mppdb/.mppdbgs_profile
  1. 执行如下命令获取出现告警的主机和数据实例的数据目录。(如下主机为10.252.153.218,数据目录为/srv/BigData/mppdb/data1/coordinator)

    复制代码
  2. 使用SSH方式登录上述主机,执行如下命令进入目录并检查是否存在postmaster.pid文件。

    复制代码
    • 是,执行5
    • 否,执行8
  3. 执行如下命令获取postmaster.pid文件中第一行的pid。

    复制代码
  4. 执行如下命令查看上述pid对应的进程是否存在。

    复制代码
    ps -ef |grep 42883
    复制代码
    omm       42883      1  4 Nov05 ?        17:25:59 /opt/huawei/Bigdata/mppdb/core/bin/gaussdb --coordinator -D /srv/BigData/mppdb/data1/coordinator
    omm      125791  55322  0 15:10 pts/0    00:00:00 grep --color=auto 42883
    • 是,执行7
    • 否,执行8
  5. 执行如下命令终止上述进程,并删除postmaster.pid文件后查看告警是否恢复。

    复制代码
    • 是,处理完毕。
    • 否,执行8
  6. 在FusionInsight Manager界面,单击"系统设置 > 日志下载"。

  7. 在"服务"下拉框中勾选"MPPDB",单击"确定"。

  8. 设置日志收集的"开始时间"和"结束时间"分别为告警产生时间的前后1小时,单击"下载"。

相关推荐
2401_87149285几秒前
Vue.js监听器watch利用回调函数处理级联下拉框数据联动
jvm·数据库·python
志栋智能35 分钟前
超自动化安全:构建智能安全运营的核心引擎
大数据·运维·服务器·数据库·安全·自动化·产品运营
xiaoduo AI1 小时前
客服机器人非工作时间能休眠?智能Agent开放平台定时唤醒,无人值守省资源?
大数据·人工智能·机器人
zhoutongsheng1 小时前
C#怎么实现Swagger文档 C#如何在ASP.NET Core中集成Swagger自动生成API文档【框架】
jvm·数据库·python
好赞科技2 小时前
深度测评2026年精选美发预约小程序排行榜 革新预约新体验 修订
大数据·微信小程序
WinterKay2 小时前
【开源】我写了一个轻量级本地数据库浏览工具,支持 MySQL/Redis 只读查询
数据库·mysql·开源
zxrhhm3 小时前
Oracle 索引完整指南
数据库·oracle
集和诚JHCTECH3 小时前
BRAV-7120加持,让有毒有害气体无处遁形
大数据·人工智能·嵌入式硬件
程序猿乐锅3 小时前
【Tilas|第三篇】多表SQL语句
数据库·经验分享·笔记·学习·mysql
Navicat中国4 小时前
使用 Navicat 导入向导导入 Excel 数据时,系统提示导入成功,表中也能看到数据,但行数统计显示为 0,这是什么原因?
数据库·excel·导入