服务器内存不够导致postgresql进程被kill的问题记录

服务器环境:Centos7.9,PGSQL14

  1. 故障现象
    平均负载飙升至80以上
    磁盘 IO 高: 故障期间磁盘 IO 明显增加
    同步异常: 主从库的复制出现问题,从库自动提升为主库

  2. 排查过程
    磁盘 IO:使用 iostat查看磁盘 IO 活动,发现磁盘读写频繁
    内存使用情况:通过报警发现内存压力较大
    dmesg:发现反复出现 PostgreSQL 进程被内存不足(OOM)杀掉的日志检查
    PostgreSQL 慢查询日志,查看活动锁,并未发现明显异常的查询或锁
  3. 原因分析
    从 dmesg 日志中看到pgsql进程被kill的信息PostgreSQL 进程因为系统内存不足被杀掉,导致同步延迟和负载飙升
    高 IO 很可能是由于进程被系统kill之后事务回滚 或 PostgreSQL 进程在崩溃后尝试恢复所导致的
  4. 解决方案
    在pgsql配置参数已调整的情况下,最有效的方案是扩大机器内存。
    如果pgsql使用默认参数,可以按机器情况调整shared_buffers 、work_mem、maintenance_work_mem等内存相关参数
相关推荐
neo_尼欧6 分钟前
DevEco Studio 报错 “too many restarts of gpu-process (jcef)“
java·服务器·前端
@阿雄21 分钟前
NGINX
服务器·nginx
江湖有缘1 小时前
【Docker管理工具】安装容器管理工具Oxker
运维·docker·容器
早起鸟儿1 小时前
docker-自动启动java 包
java·linux·运维·docker
小深ai硬件分享1 小时前
ChatGPT革命升级!o3-pro模型重磅发布:开启AI推理新纪元
运维·服务器·人工智能·深度学习
thinkMoreAndDoMore1 小时前
linux驱动开发(7)-互斥与同步
linux·运维·驱动开发
PursuitK1 小时前
Linux 基本命令
linux·服务器·linux常用命令
liulilittle1 小时前
通过高级处理器硬件指令集AES-NI实现AES-256-CFB算法。
linux·服务器·c++·算法·安全·加密·openssl
s_little_monster1 小时前
【Linux开发】海思摄像头内部视频处理模块
linux·运维·经验分享·学习·音视频·嵌入式开发·海思
steven~~~1 小时前
服务器-客户端下kafka的消息处理流程
运维·服务器·kafka