告警解释
操作系统环境文件句柄不足时,产生该告警。
告警属性
告警ID | 告警级别 | 可自动清除 |
---|---|---|
37015 | 严重 | 是 |
告警参数
参数名称 | 参数含义 |
---|---|
ServiceName | 产生告警的服务名称 |
RoleName | 产生告警的角色名称 |
HostName | 产生告警的主机名 |
Instance | 产生告警的实例 |
对系统的影响
发生文件句柄不足时,部分实例可能无法启动,集群将无法正常启动。
可能原因
操作系统文件句柄不足。
处理步骤
-
使用omm用户登录告警上报的节点。
-
初始化环境变量。
source ${BIGDATA_HOME}/mppdb/.mppdbgs_profile
-
执行以下命令连接数据库。
gsql -d postgres -p 25308
-
执行以下命令,查询max_files_per_process参数的取值是否小于默认值3000。
SHOW max_files_per_process;
回显如下类似信息。
max_files_per_process ----------------------- 2000 (1 row)
-
先退出数据库,再执行以下命令修改max_files_per_process参数取值为3000。
\q gs_guc set -Z coordinator -Z datanode -N all -I all -c 'max_files_per_process=3000'
-
执行以下命令重启集群生效。
gs_om -t stop gs_om -t start
-
检查操作系统文件句柄,关闭占用文件句柄资源较多的与数据库无关的进程。 说明: 可通过如下命令检查操作系统文件句柄配置数目以及各个进程占用的句柄数目。其中第二个命令中第一列显示的是占用的句柄数,第二列显示的为进程PID。可以关闭一些占用文件句柄较多的不重要的进程。
-
等待一段时间,查看告警是否仍然存在。
- 是,执行9。
- 否,处理完毕。
收集故障信息。
-
在FusionInsight Manager界面,单击"系统设置 > 日志下载"。
-
在"服务"下拉框中勾选"MPPDB",单击"确定"。
-
设置日志收集的"开始时间"和"结束时间"分别为告警产生时间的前后1小时,单击"下载"。