大数据-之LibrA数据库系统告警处理(ALM-37015 Gaussdb进程可用文件句柄资源不足)

告警解释

操作系统环境文件句柄不足时,产生该告警。

告警属性
告警ID 告警级别 可自动清除
37015 严重
告警参数
参数名称 参数含义
ServiceName 产生告警的服务名称
RoleName 产生告警的角色名称
HostName 产生告警的主机名
Instance 产生告警的实例
对系统的影响

发生文件句柄不足时,部分实例可能无法启动,集群将无法正常启动。

可能原因

操作系统文件句柄不足。

处理步骤
  1. 使用omm用户登录告警上报的节点。

  2. 初始化环境变量。

    复制代码
    source ${BIGDATA_HOME}/mppdb/.mppdbgs_profile
  3. 执行以下命令连接数据库。

    复制代码
    gsql -d postgres  -p  25308
  4. 执行以下命令,查询max_files_per_process参数的取值是否小于默认值3000。

    复制代码
    SHOW max_files_per_process;

    回显如下类似信息。

    复制代码
     max_files_per_process 
    -----------------------
     2000
    (1 row)
    • 是,执行5
    • 否,执行7
  5. 先退出数据库,再执行以下命令修改max_files_per_process参数取值为3000。

    复制代码
    \q  
    gs_guc set -Z coordinator -Z datanode -N all -I all -c 'max_files_per_process=3000'
  6. 执行以下命令重启集群生效。

    复制代码
    gs_om -t stop
    gs_om -t start
  7. 检查操作系统文件句柄,关闭占用文件句柄资源较多的与数据库无关的进程。 说明: 可通过如下命令检查操作系统文件句柄配置数目以及各个进程占用的句柄数目。其中第二个命令中第一列显示的是占用的句柄数,第二列显示的为进程PID。可以关闭一些占用文件句柄较多的不重要的进程。

    复制代码
  8. 等待一段时间,查看告警是否仍然存在。

    • 是,执行9
    • 否,处理完毕。

    收集故障信息。

  9. 在FusionInsight Manager界面,单击"系统设置 > 日志下载"。

  10. 在"服务"下拉框中勾选"MPPDB",单击"确定"。

  11. 设置日志收集的"开始时间"和"结束时间"分别为告警产生时间的前后1小时,单击"下载"。

相关推荐
倔强的石头_2 天前
《Kingbase护城河》——数据库存储空间全景探测与精细化瘦身实战
数据库
冬奇Lab2 天前
每日一个开源项目(第134篇):Zvec - 阿里开源的嵌入式向量数据库,向量搜索界的 SQLite
数据库·人工智能·llm
ClouGence3 天前
Oracle CDC 架构优化:从主库直连到 DataGuard 备库同步
数据库·后端·oracle
得物技术3 天前
从埋点需求到规则资产:Hermes Agent 重构得物数仓工作流
大数据·llm·ai编程
久美子3 天前
AI驱动数仓建设的Harness工程实践——本体建模、知识分层与上下文工程
大数据
无响应de神3 天前
三、用户与权限管理
数据库·mysql
大树883 天前
金刚石散热越强,管路越先见顶
大数据·运维·服务器·人工智能·ai
大志哥1233 天前
ES和Logstash日志链路系统上线后遭遇切片爆炸(解决)
大数据·elasticsearch
果丁智能3 天前
物联网智能锁赋能集中式住宿:身份核验与远程权限管控的全链路技术实践
大数据·人工智能·物联网·智能家居
麦聪聊数据3 天前
数据服务化时代:企业数据能力输出的核心路径
数据库