大数据-之LibrA数据库系统告警处理(ALM-37015 Gaussdb进程可用文件句柄资源不足)

告警解释

操作系统环境文件句柄不足时,产生该告警。

告警属性
告警ID 告警级别 可自动清除
37015 严重
告警参数
参数名称 参数含义
ServiceName 产生告警的服务名称
RoleName 产生告警的角色名称
HostName 产生告警的主机名
Instance 产生告警的实例
对系统的影响

发生文件句柄不足时,部分实例可能无法启动,集群将无法正常启动。

可能原因

操作系统文件句柄不足。

处理步骤
  1. 使用omm用户登录告警上报的节点。

  2. 初始化环境变量。

    复制代码
    source ${BIGDATA_HOME}/mppdb/.mppdbgs_profile
  3. 执行以下命令连接数据库。

    复制代码
    gsql -d postgres  -p  25308
  4. 执行以下命令,查询max_files_per_process参数的取值是否小于默认值3000。

    复制代码
    SHOW max_files_per_process;

    回显如下类似信息。

    复制代码
     max_files_per_process 
    -----------------------
     2000
    (1 row)
    • 是,执行5
    • 否,执行7
  5. 先退出数据库,再执行以下命令修改max_files_per_process参数取值为3000。

    复制代码
    \q  
    gs_guc set -Z coordinator -Z datanode -N all -I all -c 'max_files_per_process=3000'
  6. 执行以下命令重启集群生效。

    复制代码
    gs_om -t stop
    gs_om -t start
  7. 检查操作系统文件句柄,关闭占用文件句柄资源较多的与数据库无关的进程。 说明: 可通过如下命令检查操作系统文件句柄配置数目以及各个进程占用的句柄数目。其中第二个命令中第一列显示的是占用的句柄数,第二列显示的为进程PID。可以关闭一些占用文件句柄较多的不重要的进程。

    复制代码
  8. 等待一段时间,查看告警是否仍然存在。

    • 是,执行9
    • 否,处理完毕。

    收集故障信息。

  9. 在FusionInsight Manager界面,单击"系统设置 > 日志下载"。

  10. 在"服务"下拉框中勾选"MPPDB",单击"确定"。

  11. 设置日志收集的"开始时间"和"结束时间"分别为告警产生时间的前后1小时,单击"下载"。

相关推荐
YA33319 分钟前
java基础(十)sql的mvcc
数据库
The Open Group2 小时前
英特尔公司Darren Pulsipher 博士:以架构之力推动政府数字化转型
大数据·人工智能·架构
喂完待续2 小时前
【Tech Arch】Spark为何成为大数据引擎之王
大数据·hadoop·python·数据分析·spark·apache·mapreduce
三掌柜6662 小时前
NVIDIA 技术沙龙探秘:聚焦 Physical AI 专场前沿技术
大数据·人工智能
源码宝3 小时前
【智慧工地源码】智慧工地云平台系统,涵盖安全、质量、环境、人员和设备五大管理模块,实现实时监控、智能预警和数据分析。
java·大数据·spring cloud·数据分析·源码·智慧工地·云平台
weixin_307779134 小时前
VS Code配置MinGW64编译SQLite3库
开发语言·数据库·c++·vscode·算法
百思可瑞教育4 小时前
Git 对象存储:理解底层原理,实现高效排错与存储优化
大数据·git·elasticsearch·搜索引擎
SelectDB4 小时前
Apache Doris 4.0 AI 能力揭秘(一):AI 函数之 LLM 函数介绍
数据库·人工智能·数据分析
我是哈哈hh5 小时前
【MySQL】在UBuntu环境安装以及免密码登录入门
linux·数据库·mysql·ubuntu
数据超市5 小时前
香港数据合集:建筑物、手机基站、POI、职住数据、用地类型
大数据·人工智能·智能手机·数据挖掘·数据分析