大数据-之LibrA数据库系统告警处理(ALM-37017 数据库连接数超限)

告警解释

当集群中单个CN实例上某个数据库的连接数超过限制时,产生该告警。

告警属性
告警ID 告警级别 可自动清除
37017 严重
告警参数
参数名称 参数含义
ServiceName 产生告警的服务名称
RoleName 产生告警的角色名称
HostName 产生告警的主机名
Instance 产生告警的实例
databaseName 连接的数据库名称
dbUserName 连接数据库的用户名
对系统的影响

发生数据库连接数超限时,在该CN实例上无法再以普通用户访问该数据库。

可能原因

当前CN实例上访问当前数据库的连接数超过限制。

处理步骤
  1. 以数据库管理员用户(该用户有权限创建其他数据库用户,比如omm 访问上报告警的CN实例)。具体操作如下所示。

    复制代码
    gsql -d postgres -p 25308
    postgres=#
  2. 检查当前CN实例上所有数据库的连接数限制。可以看到在该CN实例上abc数据库的连接数被限制为3。

    复制代码
    postgres=# select * from pg_database;
      datname  | datdba | encoding | datcollate | datctype | datistemplate | datallowconn | datconnlimit | datlastsysoid | datfrozenxid | dattablespace |                    datacl                    
    -----------+--------+----------+------------+----------+---------------+--------------+--------------+---------------+--------------+---------------+----------------------------------------------
     template1 |     10 |        0 | C          | C        | t             | t            |           -1 |         13506 |         1336 |          1663 | {=c/xijie_trunk,xijie_trunk=CTc/xijie_trunk}
     template0 |     10 |        0 | C          | C        | t             | f            |           -1 |         13506 |         1335 |          1663 | {=c/xijie_trunk,xijie_trunk=CTc/xijie_trunk}
     postgres  |     10 |        0 | C          | C        | f             | t            |           -1 |         13506 |         1337 |          1663 | 
     abc       |     10 |        0 | C          | C        | f             | t            |            3 |         13506 |         1336 |          1663 | 
    (4 rows)
  3. 可以选择关闭部分连接或者增加连接数限制,来处理该告警。增加连接数限制操作如下。

    复制代码
    postgres=# update pg_database set datconnlimit=9 where datname='abc';
    UPDATE 1
    postgres=# select * from pg_database;
      datname  | datdba | encoding | datcollate | datctype | datistemplate | datallowconn | datconnlimit | datlastsysoid | datfrozenxid | dattablespace |                    datacl                    
    -----------+--------+----------+------------+----------+---------------+--------------+--------------+---------------+--------------+---------------+----------------------------------------------
     template1 |     10 |        0 | C          | C        | t             | t            |           -1 |         13506 |         1336 |          1663 | {=c/xijie_trunk,xijie_trunk=CTc/xijie_trunk}
     template0 |     10 |        0 | C          | C        | t             | f            |           -1 |         13506 |         1335 |          1663 | {=c/xijie_trunk,xijie_trunk=CTc/xijie_trunk}
     postgres  |     10 |        0 | C          | C        | f             | t            |           -1 |         13506 |         1337 |          1663 | 
     abc       |     10 |        0 | C          | C        | f             | t            |            9 |         13506 |         1336 |          1663 | 
    (4 rows)
  4. 再连接数据库abc,查看告警是否仍然存在。

    • 是,执行5
    • 否,处理完毕。

    收集故障信息。

  5. 在FusionInsight Manager界面,单击"系统设置 > 日志下载"。

  6. 在"服务"下拉框中勾选"MPPDB",单击"确定"。

  7. 设置日志收集的"开始时间"和"结束时间"分别为告警产生时间的前后1小时,单击"下载"。

相关推荐
秋难降8 分钟前
Python 知识点详解(二)
数据库·python·正则表达式
悟道|养家38 分钟前
数据库性能优化指南:解决ORDER BY导致的查询性能问题( SQL Server )
数据库·性能优化
czhc114007566340 分钟前
LINUX79 MYSQL
数据库·mysql
rocksun40 分钟前
使用MCP Toolbox for Databases访问数据库
数据库·人工智能·mcp
星晨雪海3 小时前
MySQL安装报错解决
数据库·mysql
好奇的菜鸟8 小时前
Spring Boot 事务失效问题:同一个 Service 类中方法调用导致事务失效的原因及解决方案
数据库·spring boot·sql
岁岁岁平安9 小时前
Redis基础学习(五大值数据类型的常用操作命令)
数据库·redis·学习·redis list·redis hash·redis set·redis string
小光学长11 小时前
基于vue框架的防疫科普网站0838x(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。
数据库
极限实验室11 小时前
使用 Docker Compose 简化 INFINI Console 与 Easysearch 环境搭建
数据库·docker·devops
飞翔的佩奇11 小时前
Java项目:基于SSM框架实现的旅游协会管理系统【ssm+B/S架构+源码+数据库+毕业论文】
java·数据库·mysql·毕业设计·ssm·旅游·jsp