Linux启动后系统可用内存不足实际配置,内存去哪儿了?

内存或者说可用内存是一个系统最终要的一个指标之一,特别是对于内存容量较小的机器(云上4GB的虚机等)来说,每1MB的内存都非常珍贵,当内存不足时可能造成系统使用swap,造成系统运行的速度和效率急剧下降,CPU冲高甚至OS卡死等。

当前我们服务在云上使用2U4G的VM,特别是在使用ARM的VM情况下经常出现内存不足的情况。

对于大家工作中熟悉的Windows系统来说,可用内存一般接近于实际的机器配置,例如当前笔者使用的PC配置为16GB DDR4内存,任务管理器中实际可用内存显示为15.8GB,如下图所示:

那么对于Linux来说是否也是这种情况呢?

笔者所在服务使用华为云现网的VM为例,同样的VM规格(c7.large.2/2U4G),安装不同系统情况下系统启动后使用free命令查到的可用内存不同,如下所示:

Euler 2.5系统:初始可用内存:3.6GB

Huawei Cloud EulerOS 2.0 标准版系统:初始可用内存:3.2GB

Ubuntu 20.04系统:初始可用内存:3.7GB

此处就非常奇怪了,不同系统的初始可用内存差异非常大,对于Linux的不同发行版,理论上来说不应该有如此大的差距。此处经过一顿网上搜索均未能得到想要的答案,只能自己想办法分析一下。

此处笔者首先想到的思路是:是否不同机器的配置不一样,造成实际可用内存大小不同?

我们知道系统的启动日志可以使用dmesg命令查询,查询启动信息中是否含有内存相关信息,如下图所示不同系统的启动信息中识别到的可用内存是一样的:

此处没有差别是否虚拟化出来的硬件有所差别?

使用dmidecode命令可以查询到系统的硬件配置(类似Windows的配置管理器),具体命令 dmidecode -t memory,可以看到配置确实是4GB内存,没有任何差异:

那我们的内存去哪儿了呢?陷入一顿沉思,是否有可能被系统自身占用?

经过一顿定位,突然想到系统日志,让我们再反过来查看欧拉系统的启动日志,发现一个可以的关键字(Reserving),预留内存512MB,并且是一个叫做crashkernel的东西,并且512这个数字也非常接近两个系统的差值,很可疑:

我们有必要怀疑是否这个叫crashkernel的玩意占用了内存,又经过一顿搜索,发现kdump主要是redhat的产品,用来记录linux内核crash时的dump文件,定位内核crash问题,并且kdump可以分配crashkernel的内核,参考文章:lzz5235.github.io/2014/10/25/...

并且具体的配置位置位于:/etc/default/grub中,RUB_CMDLINE_LINUX中一个叫做crashkernel=512M的参数,是最新的Euler2.0系统默认配置。

使用VIM对该配置进行修改,修改为1M之后,并且使用 grub2-mkconfig -o /boot/grub2/grub.cfg 命令之后reboot机器,可用内存恢复正常:

至此问题解决,唯一的副作用是,kdump模块启动不了(有利有弊),不建议大家生产环境直接修改~

另外这个是redhat的软件,Ubuntu默认是不安装的,Ubuntu安装Kdump可以参考:www.ebpf.top/post/ubuntu...

相关推荐
444A4E1 小时前
深入理解Linux进程管理:从创建到替换的完整指南
linux·c语言·操作系统
JulyYu1 小时前
Android系统保存重名文件后引发的异常解决
android·操作系统·源码
有信仰3 天前
操作系统——进程和线程
操作系统
猪哥帅过吴彦祖4 天前
从源码到可执行文件:揭秘程序编译与执行的底层魔法
操作系统·编译原理·编译器
SundayBear4 天前
Autosar Os新手入门
车载系统·操作系统·autosar os
千里镜宵烛4 天前
深入理解 Linux 线程:从概念到虚拟地址空间的全面解析
开发语言·c++·操作系统·线程
OpenAnolis小助手5 天前
朗空量子与 Anolis OS 完成适配,龙蜥获得抗量子安全能力
安全·开源·操作系统·龙蜥社区·龙蜥生态
墨夏6 天前
跨平台开发下的策略模式
设计模式·操作系统
fakerth7 天前
OpenHarmony介绍
操作系统·openharmony
程序员老刘8 天前
操作系统“卡脖子”到底是个啥?
android·开源·操作系统