阿里云系统磁盘总读BPS突然增长很高,导致网站502 Bad Gateway

问题再现

阿里云诊断提示IO延迟过长,导致读写受限

最近迁入阿里云主机(99计划2H+2G)后经常发现会出现死机的情况,呈现的状态就是网站无法访问,阿里云实例监控查看,是实例云盘读写 BPS 100M以上。

解决方向

1、调整交换分区减缓瞬时内存压力

既然发生了OOM,那必然是内存捉襟见肘了。这里先根据网友 @慧眼见真 增加 swap 试试看。

以下均为 root 权限执行

复制代码
# 查看系统内存情况
free -h

# 查看交换内容情况
swapon --show

# 指定 swap 文件并分配 3G 大小
fallocate -l 3G /swapfile

# 修改权限
chmod 600 /swapfile

# 格式化为 swap
mkswap /swapfile

# 启用 swap
swapon /swapfile

# 永久启用
echo '/swapfile swap swap defaults 0 0' >> /etc/fstab
重要!接下来需要调整内存交换性
复制代码
# 查看交换分区积极性,当为 0 表示不使用交换分区
cat /proc/sys/vm/swappiness

# 临时调整
# 可以简单理解为当内存占用 (100-10)% 时开始使用交换分区
sysctl vm.swappiness=10

# 永久调整
vim /etc/sysctl.conf
vm.swappiness=10

# 重新加载内核参数配置
sysctl -p

禁用dnf的自动更新

复制代码
# 确认相关任务存在
systemctl list-timers 'dnf-*'

# 禁用任务
systemctl stop dnf-makecache.timer
systemctl disable dnf-makecache.timer

# 之后我们可以手动更新
dnf check-update

参考文章阿里云 系统磁盘总读BPS 突然增长很高,导致网站502 Bad Gateway_问答-阿里云开发者社区 (aliyun.com)如何在 Linux 上创建和使用交换文件 (linux-console.net)

后话:

当然,如果你的程序确实有较大占用内存的如MySQL,可以适当配置参数降低占用。不同内存大小的MySQL配置方案 -- wking's blog (wkings.blog)

1核1G内存云服务器的mysql5.7内存占用过大参数优化

相关推荐
可观测性用观测云12 小时前
阿里云 Tair 集群版可观测最佳实践
云计算·监控
许国栋_16 小时前
B2B企业如何建设价值管理办公室(VMO)?实践与落地解析
人工智能·安全·云计算·产品经理
亚林瓜子18 小时前
为AWS ElastiCache添加CPU和内存利用率告警
云计算·aws
SaaS_Product20 小时前
企业网盘哪个好?企业网盘选型需求分析
大数据·云计算·saas·onedrive
独自破碎E20 小时前
告别腾讯云 COS,用 GitHub + jsDelivr 搭建零成本图床
云计算·github·腾讯云
TG_yunshuguoji21 小时前
阿里云代理商:怎么创建和连接RDS云数据库?
数据库·阿里云·云计算
gaize121321 小时前
阿里云通用算力 u1|均衡性能省心之选
阿里云·云计算
weixin_4573418921 小时前
2026年阿里云ECS服务器全攻略:从基础认知和价格体系到购买以及部署流程
服务器·阿里云·云计算
沐欣工作室_lvyiyi21 小时前
基于腾讯云的智能家居监控系统的设计开发(论文+源码)
单片机·云计算·毕业设计·智能家居·腾讯云
道清茗21 小时前
【Kubernetes知识点问答题】Kustomize、CRD 与 Gateway API
容器·kubernetes·gateway