Linux启动后系统可用内存不足实际配置,内存去哪儿了?

内存或者说可用内存是一个系统最终要的一个指标之一,特别是对于内存容量较小的机器(云上4GB的虚机等)来说,每1MB的内存都非常珍贵,当内存不足时可能造成系统使用swap,造成系统运行的速度和效率急剧下降,CPU冲高甚至OS卡死等。

当前我们服务在云上使用2U4G的VM,特别是在使用ARM的VM情况下经常出现内存不足的情况。

对于大家工作中熟悉的Windows系统来说,可用内存一般接近于实际的机器配置,例如当前笔者使用的PC配置为16GB DDR4内存,任务管理器中实际可用内存显示为15.8GB,如下图所示:

那么对于Linux来说是否也是这种情况呢?

笔者所在服务使用华为云现网的VM为例,同样的VM规格(c7.large.2/2U4G),安装不同系统情况下系统启动后使用free命令查到的可用内存不同,如下所示:

Euler 2.5系统:初始可用内存:3.6GB

Huawei Cloud EulerOS 2.0 标准版系统:初始可用内存:3.2GB

Ubuntu 20.04系统:初始可用内存:3.7GB

此处就非常奇怪了,不同系统的初始可用内存差异非常大,对于Linux的不同发行版,理论上来说不应该有如此大的差距。此处经过一顿网上搜索均未能得到想要的答案,只能自己想办法分析一下。

此处笔者首先想到的思路是:是否不同机器的配置不一样,造成实际可用内存大小不同?

我们知道系统的启动日志可以使用dmesg命令查询,查询启动信息中是否含有内存相关信息,如下图所示不同系统的启动信息中识别到的可用内存是一样的:

此处没有差别是否虚拟化出来的硬件有所差别?

使用dmidecode命令可以查询到系统的硬件配置(类似Windows的配置管理器),具体命令 dmidecode -t memory,可以看到配置确实是4GB内存,没有任何差异:

那我们的内存去哪儿了呢?陷入一顿沉思,是否有可能被系统自身占用?

经过一顿定位,突然想到系统日志,让我们再反过来查看欧拉系统的启动日志,发现一个可以的关键字(Reserving),预留内存512MB,并且是一个叫做crashkernel的东西,并且512这个数字也非常接近两个系统的差值,很可疑:

我们有必要怀疑是否这个叫crashkernel的玩意占用了内存,又经过一顿搜索,发现kdump主要是redhat的产品,用来记录linux内核crash时的dump文件,定位内核crash问题,并且kdump可以分配crashkernel的内核,参考文章:lzz5235.github.io/2014/10/25/...

并且具体的配置位置位于:/etc/default/grub中,RUB_CMDLINE_LINUX中一个叫做crashkernel=512M的参数,是最新的Euler2.0系统默认配置。

使用VIM对该配置进行修改,修改为1M之后,并且使用 grub2-mkconfig -o /boot/grub2/grub.cfg 命令之后reboot机器,可用内存恢复正常:

至此问题解决,唯一的副作用是,kdump模块启动不了(有利有弊),不建议大家生产环境直接修改~

另外这个是redhat的软件,Ubuntu默认是不安装的,Ubuntu安装Kdump可以参考:www.ebpf.top/post/ubuntu...

相关推荐
F_Quant2 天前
🚀 Python打包踩坑指南:彻底解决 Nuitka --onefile 配置文件丢失与重启报错问题
python·操作系统
序安InToo2 天前
第6课|注释与代码风格
后端·操作系统·嵌入式
chlk1234 天前
Linux文件权限完全图解:读懂 ls -l 和 chmod 755 背后的秘密
linux·操作系统
张小潇7 天前
AOSP15 Input专题InputManager源码分析
android·操作系统
何中应7 天前
vi编辑器使用
linux·后端·操作系统
何中应7 天前
Linux进程无法被kill
linux·后端·操作系统
何中应7 天前
rm-rf /命令操作介绍
linux·后端·操作系统
何中应7 天前
Linux常用命令
linux·操作系统
_OP_CHEN8 天前
【Linux系统编程】(四十)线程控制终极指南:从资源共享到实战操控,带你吃透线程全生命周期
linux·运维·操作系统·线程·进程·c/c++·线程控制
炸膛坦客9 天前
FreeRTOS 学习:(二十九)任务切换的底层逻辑(了解)
单片机·操作系统·freertos