大数据-之LibrA数据库系统告警处理(ALM-37002 MPPDB实例连接数超限)

告警解释

CN实例中的客户端连接数量超过了其postgresql.conf配置文件配置的最大可用告警上限(max_connections*connection_alarm_rate)时,产生该告警。

告警属性
告警ID 告警级别 可自动清除
37002 严重
告警参数
参数名称 参数含义
ServiceName 产生告警的服务名称
RoleName 产生告警的角色名称
HostName 产生告警的主机名
Instance 产生告警的实例
对系统的影响

CN实例将无法接受新的客户端连接。

可能原因

CN实例中的客户端连接数量超过了其postgresql.conf配置文件配置的最大可用告警上限(max_connections*connection_alarm_rate)。

处理步骤

扩展max_connections值。

  1. 使用omm 用户登录告警上报的节点,执行source ${BIGDATA_HOME}/mppdb/.mppdbgs_profil初始化环境变量。

  2. 使用如下命令,修改告警CN的最大连接数,将原有连接数调大。假设告警主机为plat1,将连接数调整至3000。 gs_guc set -Z coordinator -N plat1 -I all -c "max_connections = 3000"

  3. 在FusionInsight Manager首页,单击"服务管理 > MPPDB",单击"更多操作 > 重启服务" 。

  4. 查看告警是否恢复。

    1. 是,处理完毕。
    2. 否,执行5

收集故障信息。

  1. 在FusionInsight Manager界面,单击"系统设置 > 日志下载"。
  2. 在"服务"下拉框中勾选"MPPDB",单击"确定"。
  3. 设置日志收集的"开始时间"和"结束时间"分别为告警产生时间的前后1小时,单击"下载"。
相关推荐
这个DBA有点耶15 小时前
NULL不是空——数据库里最反直觉的设计,90%新人踩过的坑
数据库·mysql·代码规范
Databend16 小时前
2KB histogram 背后:Databend 如何低成本追踪长尾延迟
大数据·数据分析·agent
这个DBA有点耶17 小时前
AI写的SQL跑崩了生产库,这锅谁背?
数据库·人工智能·程序员
镜舟科技17 小时前
Databricks 再提 LTAP,AI 时代的数据底座为何重回大一统叙事?
数据库·架构·agent
Databend18 小时前
从湖仓升级为 Agent 时代的数据控制面,Snowflake 和 Databricks 有哪些布局
大数据·数据库·agent
ClouGence21 小时前
SQL Server CDC 能放到 Always On 备库读吗?一文讲透原理与实践
数据库·sql server
先吃饱再说2 天前
存储的进化:从 MySQL 到浏览器缓存,数据到底住在哪?
数据库
Nturmoils2 天前
字段太多看不全,ksql 的展开模式和输出控制怎么用
数据库·后端
阿里云大数据AI技术2 天前
StarRocks x Fluss x Paimon湖流一体方案:构建秒级响应、湖流一体的实时数据引擎
大数据·人工智能
Databend2 天前
Agent 轨迹分析与归因的数据工程实践
大数据·数据库·agent