android的lmkd的实现及代码分析

一、背景

对于一些内存比较容易吃紧的系统，除了有合理的内存的规划并持续的优化使用的内存以外，还需要增加一些措施来监控内存的使用，并在系统出现内存压力时及时做出响应。

android的lmkd就是这么一个服务，在这篇博客里，我们介绍lmkd的实现及代码分析。

二、整体介绍

高版本android不再依赖一个专门的定制的ko来辅助做内存紧张时的决定杀哪个进程的决策逻辑，而是完全依赖内核现有的psi的功能来完成内存的压力监测。

lmkd定义了三级内存压力水位，在达到某一级别的内存压力时，找到大于等于这个一别的内存压力水位所对应的oom_adj的所有进程里的"占内存最多的或是oom_adj最高"的任务来杀掉。"占内存最多的或是oom_adj最高"由配置决定。

所以lmkd是一个纯用户态实现，对系统的内核的依赖只在于需要使能CONFIG_PSI，而如果不打开CONFIG_PSI的话，且用的是cgroup v1的话，也可以使用cgroup v1里的vmpressure的相关节点，要注意vmpressure是一个被淘汰的功能，开启cgroup v2的话并不使用它，vmpressure存在大量误报的情况。

在下面一章里，我们分下面两个方面来介绍：

1）lmkd里有哪些配置------这里说的配置不仅包括代码里写死的配置，也包括android项目里的环境变量的配置

2）lmkd的代码主要流程

我们所讲的这份lmkd的源码是链接 android的lmkd的一份源码参考里的。整理的lmkd的代码流程图见链接 android的lmkd的流程图。另外，lmkd所用到的内核的psi的能力的介绍博客见内核的PSI的原理及代码分析。

三、细节展开

3.1 lmkd有哪些配置？

下面列举的是比较重要的一些配置值。

3.1.1 代码里定义的三级psi内存水位阈值及对应的oom_adj数值

在源码里的lmkd.c里有定义如下数组：

对应于设置根内存压力节点写入上图里的some/full，对于1秒的周期内，出现70ms/100ms/70ms的部分/部分/全部的因为内存压力而导致的任务停顿。

注意，上图里的这些水位配置是固定死的配置，属于经验数值。

与上面的这三种压力水位对应的有三个oom_adj的数值，代码里是通过获取属性值来拿到：

property_get_int32("ro.lmk.low", OOM_SCORE_ADJ_MAX + 1);

property_get_int32("ro.lmk.medium", 800);

property_get_int32("ro.lmk.critical", 0);

3.1.2 杀掉进程后的"冷静期"时间

刚杀掉一个进程后，有一个冷静期，在这个期间不再杀更多进程：

property_get_int32("ro.lmk.kill_timeout_ms", 0);

3.1.3 压力等级升级和降级相关的配置

这里所谓的升级和降级是指虽然有触碰到上面 3.1.1 里介绍的代码里固定死的内存压力水位，可以通过用户配置，来决定是否升级这个触碰到的某一级别的内存压力。比如，触碰到low的内存压力，根据系统状态看是否升级到medium，又比如，触碰到critical的内存压力，根据系统状态看是否降级到medium。而这里说的所谓"根据系统状态"就是这一节所讲到的配置项。

有关判断是否需要升级的"根据系统状态"的配置项是：

property_get_int32("ro.lmk.upgrade_pressure", 100);

它的运算方式是（usage/usage+swap），即内存总使用量除以（内存总使用量+swap分区使用量），如下图，如果发现当前系统里的（usage/usage+swap）比属性定的阈值upgrade_pressure要小，也就说明swap的使用量比较多，那就需要升级压力等级：

有关判断是否需要降级的"根据系统状态"的配置项有两个：

swap_free_low_percentage =

property_get_int32("ro.lmk.downgrade_pressure", 100);

downgrade_pressure =

(int64_t)property_get_int32("ro.lmk.downgrade_pressure", 100);

能降级的条件是：

free_swap/total_swap大于等于swap_free_low_percentage

且

usage/(usage+swap)的比率大于downgrade_pressure

注意，usage/(usage+swap)的数值，无论是判断升级还是判断降级都是需要用的，用的是同一个数值：

3.1.4 "是否是杀掉内存最多的任务"的配置项

在执行某个压力水位的杀进程的操作时，首先有一个oom_adj的数值，这个数值决定一个oom_adj的下限，注意，进程的oom_score越低，就越不能杀，所以在选要杀的任务时，如下图，判断大于等于oom_adj的数值的这些任务，都可以被选择杀掉的：

逻辑是从max的oom_score不断地减一来遍历，如果oom_score对应的槽位有任务，就返回，用的是ADJTOSLOT宏来通过oom_score找到对应的槽位，但是要根据当前的配置，配置如果是在满足大于等于oom_adj数值的任务里挑选内存使用量最大的任务，则走下图里的这个proc_get_heaviest函数：