大数据-之LibrA数据库系统告警处理(ALM-37017 数据库连接数超限)

告警解释

当集群中单个CN实例上某个数据库的连接数超过限制时,产生该告警。

告警属性
告警ID 告警级别 可自动清除
37017 严重
告警参数
参数名称 参数含义
ServiceName 产生告警的服务名称
RoleName 产生告警的角色名称
HostName 产生告警的主机名
Instance 产生告警的实例
databaseName 连接的数据库名称
dbUserName 连接数据库的用户名
对系统的影响

发生数据库连接数超限时,在该CN实例上无法再以普通用户访问该数据库。

可能原因

当前CN实例上访问当前数据库的连接数超过限制。

处理步骤
  1. 以数据库管理员用户(该用户有权限创建其他数据库用户,比如omm 访问上报告警的CN实例)。具体操作如下所示。

    复制代码
    gsql -d postgres -p 25308
    postgres=#
  2. 检查当前CN实例上所有数据库的连接数限制。可以看到在该CN实例上abc数据库的连接数被限制为3。

    复制代码
    postgres=# select * from pg_database;
      datname  | datdba | encoding | datcollate | datctype | datistemplate | datallowconn | datconnlimit | datlastsysoid | datfrozenxid | dattablespace |                    datacl                    
    -----------+--------+----------+------------+----------+---------------+--------------+--------------+---------------+--------------+---------------+----------------------------------------------
     template1 |     10 |        0 | C          | C        | t             | t            |           -1 |         13506 |         1336 |          1663 | {=c/xijie_trunk,xijie_trunk=CTc/xijie_trunk}
     template0 |     10 |        0 | C          | C        | t             | f            |           -1 |         13506 |         1335 |          1663 | {=c/xijie_trunk,xijie_trunk=CTc/xijie_trunk}
     postgres  |     10 |        0 | C          | C        | f             | t            |           -1 |         13506 |         1337 |          1663 | 
     abc       |     10 |        0 | C          | C        | f             | t            |            3 |         13506 |         1336 |          1663 | 
    (4 rows)
  3. 可以选择关闭部分连接或者增加连接数限制,来处理该告警。增加连接数限制操作如下。

    复制代码
    postgres=# update pg_database set datconnlimit=9 where datname='abc';
    UPDATE 1
    postgres=# select * from pg_database;
      datname  | datdba | encoding | datcollate | datctype | datistemplate | datallowconn | datconnlimit | datlastsysoid | datfrozenxid | dattablespace |                    datacl                    
    -----------+--------+----------+------------+----------+---------------+--------------+--------------+---------------+--------------+---------------+----------------------------------------------
     template1 |     10 |        0 | C          | C        | t             | t            |           -1 |         13506 |         1336 |          1663 | {=c/xijie_trunk,xijie_trunk=CTc/xijie_trunk}
     template0 |     10 |        0 | C          | C        | t             | f            |           -1 |         13506 |         1335 |          1663 | {=c/xijie_trunk,xijie_trunk=CTc/xijie_trunk}
     postgres  |     10 |        0 | C          | C        | f             | t            |           -1 |         13506 |         1337 |          1663 | 
     abc       |     10 |        0 | C          | C        | f             | t            |            9 |         13506 |         1336 |          1663 | 
    (4 rows)
  4. 再连接数据库abc,查看告警是否仍然存在。

    • 是,执行5
    • 否,处理完毕。

    收集故障信息。

  5. 在FusionInsight Manager界面,单击"系统设置 > 日志下载"。

  6. 在"服务"下拉框中勾选"MPPDB",单击"确定"。

  7. 设置日志收集的"开始时间"和"结束时间"分别为告警产生时间的前后1小时,单击"下载"。

相关推荐
DBA小马哥3 小时前
Oracle迁移实战:如何轻松跨越异构数据库的学习与技术壁垒
数据库·学习·oracle·信创·国产化平替
暮乘白帝过重山3 小时前
ArkTS ForEach 参数解析:组件与键值生成器
开发语言·数据库
菜鸟plus+4 小时前
N+1查询
java·服务器·数据库
子夜江寒4 小时前
MySQL 表创建与数据导入导出
数据库·mysql
菜鸟小九4 小时前
redis基础(安装配置redis)
数据库·redis·缓存
保定公民5 小时前
达梦数据库使用cp备份集恢复报错分析与解决
数据库
中冕—霍格沃兹软件开发测试6 小时前
测试用例库建设与管理方案
数据库·人工智能·科技·开源·测试用例·bug
The star"'6 小时前
mysql(4-7)
数据库·mysql·adb
jiayong237 小时前
Redis面试深度解析
数据库·redis·面试
思成不止于此7 小时前
【MySQL 零基础入门】DQL 核心语法(四):执行顺序与综合实战 + DCL 预告篇
数据库·笔记·学习·mysql