大数据-之LibrA数据库系统告警处理(ALM-37017 数据库连接数超限)

告警解释

当集群中单个CN实例上某个数据库的连接数超过限制时,产生该告警。

告警属性
告警ID 告警级别 可自动清除
37017 严重
告警参数
参数名称 参数含义
ServiceName 产生告警的服务名称
RoleName 产生告警的角色名称
HostName 产生告警的主机名
Instance 产生告警的实例
databaseName 连接的数据库名称
dbUserName 连接数据库的用户名
对系统的影响

发生数据库连接数超限时,在该CN实例上无法再以普通用户访问该数据库。

可能原因

当前CN实例上访问当前数据库的连接数超过限制。

处理步骤
  1. 以数据库管理员用户(该用户有权限创建其他数据库用户,比如omm 访问上报告警的CN实例)。具体操作如下所示。

    复制代码
    gsql -d postgres -p 25308
    postgres=#
  2. 检查当前CN实例上所有数据库的连接数限制。可以看到在该CN实例上abc数据库的连接数被限制为3。

    复制代码
    postgres=# select * from pg_database;
      datname  | datdba | encoding | datcollate | datctype | datistemplate | datallowconn | datconnlimit | datlastsysoid | datfrozenxid | dattablespace |                    datacl                    
    -----------+--------+----------+------------+----------+---------------+--------------+--------------+---------------+--------------+---------------+----------------------------------------------
     template1 |     10 |        0 | C          | C        | t             | t            |           -1 |         13506 |         1336 |          1663 | {=c/xijie_trunk,xijie_trunk=CTc/xijie_trunk}
     template0 |     10 |        0 | C          | C        | t             | f            |           -1 |         13506 |         1335 |          1663 | {=c/xijie_trunk,xijie_trunk=CTc/xijie_trunk}
     postgres  |     10 |        0 | C          | C        | f             | t            |           -1 |         13506 |         1337 |          1663 | 
     abc       |     10 |        0 | C          | C        | f             | t            |            3 |         13506 |         1336 |          1663 | 
    (4 rows)
  3. 可以选择关闭部分连接或者增加连接数限制,来处理该告警。增加连接数限制操作如下。

    复制代码
    postgres=# update pg_database set datconnlimit=9 where datname='abc';
    UPDATE 1
    postgres=# select * from pg_database;
      datname  | datdba | encoding | datcollate | datctype | datistemplate | datallowconn | datconnlimit | datlastsysoid | datfrozenxid | dattablespace |                    datacl                    
    -----------+--------+----------+------------+----------+---------------+--------------+--------------+---------------+--------------+---------------+----------------------------------------------
     template1 |     10 |        0 | C          | C        | t             | t            |           -1 |         13506 |         1336 |          1663 | {=c/xijie_trunk,xijie_trunk=CTc/xijie_trunk}
     template0 |     10 |        0 | C          | C        | t             | f            |           -1 |         13506 |         1335 |          1663 | {=c/xijie_trunk,xijie_trunk=CTc/xijie_trunk}
     postgres  |     10 |        0 | C          | C        | f             | t            |           -1 |         13506 |         1337 |          1663 | 
     abc       |     10 |        0 | C          | C        | f             | t            |            9 |         13506 |         1336 |          1663 | 
    (4 rows)
  4. 再连接数据库abc,查看告警是否仍然存在。

    • 是,执行5
    • 否,处理完毕。

    收集故障信息。

  5. 在FusionInsight Manager界面,单击"系统设置 > 日志下载"。

  6. 在"服务"下拉框中勾选"MPPDB",单击"确定"。

  7. 设置日志收集的"开始时间"和"结束时间"分别为告警产生时间的前后1小时,单击"下载"。

相关推荐
秋意零22 分钟前
【排坑指南】MySQL初始化后,Nacos与微服务无法连接??
运维·数据库·mysql·微服务·nacos·报错
麓殇⊙1 小时前
操作系统期末复习--操作系统初识以及进程与线程
java·大数据·数据库
fouryears_234171 小时前
深入理解 MySQL 事务:保障数据操作的原子性与一致性
数据库·mysql
凌冰_1 小时前
Springboot MyBatis 数据库连接池
数据库·spring boot·mybatis
Elastic 中国社区官方博客2 小时前
使用 Elasticsearch 提升 Copilot 能力
大数据·数据库·elasticsearch·搜索引擎·全文检索·copilot·mcp
你是橙子那我是谁2 小时前
Redis中的分布式锁之SETNX底层实现
数据库·redis·分布式
F36_9_2 小时前
如何高效实现公司文件管理
大数据·数据库·人工智能
string小白3 小时前
【SQL】视图
java·数据库·sql
中国lanwp3 小时前
DBeaver 中 Greenplum、PostgreSQL 和 PostgreSQL (old) 驱动的区别
数据库·postgresql
考虑考虑3 小时前
update语句使用表中的字段更新
数据库·后端