服务器内存不够导致postgresql进程被kill的问题记录

服务器环境:Centos7.9,PGSQL14

  1. 故障现象
    平均负载飙升至80以上
    磁盘 IO 高: 故障期间磁盘 IO 明显增加
    同步异常: 主从库的复制出现问题,从库自动提升为主库

  2. 排查过程
    磁盘 IO:使用 iostat查看磁盘 IO 活动,发现磁盘读写频繁
    内存使用情况:通过报警发现内存压力较大
    dmesg:发现反复出现 PostgreSQL 进程被内存不足(OOM)杀掉的日志检查
    PostgreSQL 慢查询日志,查看活动锁,并未发现明显异常的查询或锁
  3. 原因分析
    从 dmesg 日志中看到pgsql进程被kill的信息PostgreSQL 进程因为系统内存不足被杀掉,导致同步延迟和负载飙升
    高 IO 很可能是由于进程被系统kill之后事务回滚 或 PostgreSQL 进程在崩溃后尝试恢复所导致的
  4. 解决方案
    在pgsql配置参数已调整的情况下,最有效的方案是扩大机器内存。
    如果pgsql使用默认参数,可以按机器情况调整shared_buffers 、work_mem、maintenance_work_mem等内存相关参数
相关推荐
tt666qq2 小时前
linux进程与服务
linux·运维·网络
云泽8082 小时前
Linux 入门指南:从零掌握基础文件与目录操作命令
linux·运维·服务器
心灵宝贝3 小时前
unzip-6.0-21.el7.x86_64.rpm怎么安装?CentOS 7手动安装rpm包详细步骤
linux·运维·centos
Lin_Aries_04213 小时前
基于 CI/CD 平台将应用程序自动部署到 Kubernetes 集群
运维·ci/cd·docker·云原生·容器·kubernetes·jenkins
可DRAK鸦|・ω・`)3 小时前
ArcGIS数据迁移问题汇总(postgresql)
数据库·postgresql
你的人类朋友3 小时前
DevOps是什么?
运维·自动化运维·devops
奶糖 肥晨4 小时前
批量重命名技巧:使用PowerShell一键整理图片文件命名规范
android·服务器·数据库
迎風吹頭髮4 小时前
UNIX下C语言编程与实践23-模拟 UNIX ls -l 命令:lsl 程序的设计与实现全流程
服务器·c语言·unix
励志不掉头发的内向程序员5 小时前
【Linux系列】并发世界的基石:透彻理解 Linux 进程 — 进程概念
linux·运维·服务器·开发语言·学习
神的孩子都在歌唱5 小时前
PostgreSQL向量检索:pgvector入门指南
数据库·postgresql