文件页的预取逻辑

一、背景

在之前的博客 vmlck大于rss的问题分析-CSDN博客里，我们分析了一个进程的vmlck内存统计值大于rss统计值的问题，里面详细分析了内存统计更新的逻辑及原理，里面的 2.2 问题原因里也提到了进入handle_mm_fault的节奏并不是每个4k页进入一次的，在这篇博客里，我们会展开描述一下。

在这篇博客里的分析过程中会展示一些抓到的堆栈情况，所用到的抓取堆栈的调试程序会在后面的博客里进行介绍，这里聚焦到介绍handle_mm_fault进入节奏的相关细节。有关缺页异常的主要逻辑链的流程含义可以见之前的博客内存管理之------get_user_pages和pin_user_pages及缺页异常_get user page-CSDN博客里的第四章。

二、handle_mm_fault并不一定是每个page触发进入一次的

在之前分析博客 vmlck大于rss的问题分析-CSDN博客里的问题时，其实是写过一个测试的ko和一个测试的用户态堆栈解析程序来辅助定位问题的，关于这个ko和上层程序的介绍会在后面的博客里进行。

2.1 抓取执行到check_sync_rss_stat时进程的内存统计值状态进行分析

这里先贴出抓到的信息情况，下图里抓的是低版本内核里在每次执行到add_mm_counter/inc_mm_counter/dec_mm_counter时的情况（用了之前的博客简易的替代tracepoint的调试手段的进一步改进-CSDN博客里的打桩的方法，抓的执行到check_sync_rss_stat时进行的下图的打印）：

从上图可以看到，连续的这几次start到end的区间所触发的handle_mm_fault并不是每个page都触发一次的，上图中的行末的index是指当前处理的这个page在文件里所有的从0开始的page的序号。

可以看到，两次check_sync_rss_stat之间，隔着的index需要时16，而check_sync_rss_stat函数只在handle_mm_fault最一开始被调用，说明同一个文件的两次handle_mm_fault隔了有16个page，如果按照默认的4k为PAGE_SIZE的话，就是64k。

2.2 文件页缺页异常触发节奏的相关原理

从上面 2.1 里我们通过日志观测到文件页的缺页异常并不是一次次page为颗粒度地进入到handle_mm_fault函数里，而是相隔了64k的大小。

事实上，对于文件页的缺页异常，内核里无论是低版本内核还是高版本内核都是有预取逻辑的。

预取逻辑的核心函数是do_fault_around，在do_fault_around函数的注释里也解释其用意：

为的是减少缺页异常处理的次数。

相比"文件页的缺页异常并不是一次次page为颗粒度地进入到handle_mm_fault函数里，而是相隔了64k的大小"的说法，更准确的说法是，虽然缺页异常是PAGE_SIZE的粒度进行，但是因为内核有临近预取的机制，所以，在触发了某个文件页的缺页异常之后，后续临近的同一个映射的vma上的文件页也会跟着被触发缺页异常里的逻辑，这些临近的页的缺页的逻辑在同一次handle_mm_fault的调用里完成。