服务器通用(全架构)【页缓存（Page Cache）原理与运维实践分析】技术文章

了解更多银河麒麟操作系统全新产品，请点击访问：

麒麟软件产品专区：https://www.kylinos.cn/productPc/

开发者专区：https://developer.kylinos.cn/

文档中心：https://document.kylinos.cn/document/center

一、文档简介

在Linux服务器的内存管理体系中，页缓存（Page Cache，也称文件缓存）是提升磁盘I/O性能的核心机制。其本质是内核将磁盘中的文件数据暂存到物理内存中，当进程再次访问相同数据时，可直接从内存读取而非耗时的磁盘读写，从而大幅降低响应延迟。

本文聚焦页缓存的底层原理，解析其数据流转机制，结合生产环境中常见的"缓存命中率低""内存被缓存占满"等问题展开分析，并提供可落地的优化策略，为运维人员理解和调优页缓存提供技术参考。

二、页缓存核心原理

2.1 核心设计理念

Linux的设计哲学之一是"最大化利用空闲内存"，页缓存正是这一理念的典型体现：当物理内存存在空闲时，内核会主动将进程访问过的磁盘文件数据加载到内存中形成页缓存；当内存不足时，内核再通过淘汰策略回收部分不常用的页缓存空间，分配给活跃进程。

页缓存的单位与内存管理的基本单位一致------"页（Page）"，通常为4KB（可通过getconf PAGE_SIZE命令查看）。对于大文件，内核会以连续页的形式存储，形成"页簇"，进一步提升读写效率。

2.2 关键技术机制

2.2.1 数据加载机制：预读与按需加载

页缓存的加载分为"按需加载"和"预读（Read-Ahead）"两种方式：

按需加载：进程首次访问某文件数据时，内核会将对应的数据块从磁盘加载到内存页中，并建立"文件inode-页缓存"的映射关系，后续同一进程或其他进程访问该数据时，直接命中缓存；
预读机制：内核基于"局部性原理"（进程访问某数据时，大概率会访问其相邻数据），在按需加载时额外加载后续的1-2个页数据。例如，进程读取文件的第1个4KB页时，内核会同步加载第2、3个页，预读大小可通过blockdev --getra /dev/sda查看（单位：512字节扇区，默认128即64KB）。

2.2.2 缓存淘汰机制：LRU改进算法

当物理内存不足时，内核需淘汰部分页缓存以释放空间，采用的是"改进型LRU（最近最少使用）"算法，核心是维护两个链表：

活跃链表（Active List）：存储最近被频繁访问的页缓存，内核优先保留；
非活跃链表（Inactive List）：存储较少被访问的页缓存，是淘汰的优先对象。

进程访问页缓存时，内核会将其从非活跃链表移至活跃链表；当活跃链表满时，会将最久未访问的页"降级"到非活跃链表。这种机制既保证了常用数据的缓存命中率，又能高效回收闲置缓存。

2.2.3 写缓存机制：回写与同步

为提升写性能，页缓存采用"写后缓存"策略，即进程写入数据时，先写入页缓存并标记为"脏页（Dirty Page）"，然后立即返回，内核再通过后台线程（如pdflush、flusher线程）异步将脏页同步到磁盘。关键机制包括：

脏页阈值：当脏页占总内存比例达到阈值（如默认脏页比例20%）时，内核触发同步回写；
超时回写：即使未达阈值，脏页也会在超时后（默认30秒）被同步到磁盘，避免数据丢失；
强制同步：进程可通过sync、fsync命令强制将脏页同步到磁盘，如数据库事务提交时会调用fsync保证数据持久化。

三、常见问题分析与排查

3.1 问题1：缓存命中率低，磁盘I/O居高不下

3.1.1 现象表现

通过iostat -x 1 5查看，磁盘%util（繁忙度）持续超过80%，而通过free -h查看内存有大量空闲，说明页缓存未有效发挥作用。

3.1.2 根源分析

数据访问模式随机：如数据库的随机读写场景，进程频繁访问不同文件块，页缓存无法重复命中；
预读配置不合理：小文件随机访问时，预读的大量数据未被使用，反而占用缓存空间；
缓存被频繁回收：活跃进程内存需求大，导致页缓存刚加载就被淘汰。

3.1.3 排查与解决

分析访问模式：通过pidstat -d 1 -p 进程PID查看进程的磁盘I/O特征，确认是否为随机读写；
调整预读大小：随机读写场景减小预读值，如blockdev --setra 32 /dev/sda（32×512字节=16KB）；
优化缓存策略：若为数据库场景，可调整数据库自身缓存（如MySQL的InnoDB Buffer Pool），减少对页缓存的依赖；
验证命中率：通过cat /proc/vmstat | grep pg计算缓存命中率，公式为：命中率=(pgpgin - pgswapin - pgdirty) / pgpgin × 100%（pgpgin为页缓存加载量，pgdirty为脏页量）。

3.2 问题2：内存被页缓存占满，应用OOM

3.2.1 现象表现

通过free -h查看，Mem栏的"used"接近总内存，"buff/cache"占比超过60%，而"available"不足10%，最终导致应用因内存不足被OOM Killer终止。

3.2.2 根源分析

Linux页缓存默认会尽可能占用空闲内存，但当活跃进程需要内存时，内核应自动回收缓存。若出现缓存无法回收，可能原因包括：

大量脏页未同步：脏页未完成磁盘回写前，内核无法回收，导致缓存堆积；
内核参数配置不合理：如vm.min_free_kbytes（最小空闲内存）设置过大，或vm.swappiness设置过低，导致内核优先使用swap而非回收缓存；
应用内存泄漏：应用占用内存持续增长，挤压缓存回收空间。

3.2.3 排查与解决

查看脏页状态：通过cat /proc/vmstat | grep dirty查看脏页数量，若nr_dirty数值过大，执行sync命令强制同步；
临时释放缓存：执行sync && echo 3 > /proc/sys/vm/drop_caches（sync确保数据安全，echo 3表示回收页缓存、目录缓存和inode缓存）；
调整内核参数 ：
减小vm.min_free_kbytes：如sysctl -w vm.min_free_kbytes=65536（64MB），避免预留过多空闲内存；
提高vm.swappiness：如sysctl -w vm.swappiness=30，让内核更倾向于回收缓存而非使用swap；
调整脏页阈值：如sysctl -w vm.dirty_ratio=15（脏页占比达15%触发回写），sysctl -w vm.dirty_background_ratio=5（后台回写阈值5%）。
排查内存泄漏：通过top -o %MEM或ps aux --sort=-%mem | head -10定位高内存进程，结合strace或应用监控工具（如Java的jmap）分析是否存在内存泄漏。

3.3 问题3：服务器重启后缓存失效，I/O突发增高

3.3.1 现象表现

服务器重启后，应用启动初期磁盘I/O突发增高，响应延迟明显增加，随着运行时间增长，I/O逐渐下降并趋于稳定。

3.3.2 根源分析

页缓存是基于内存的临时存储，服务器重启后内存清空，所有数据需重新从磁盘加载，导致"缓存冷启动"问题。对于大文件或高频访问数据，冷启动阶段的I/O压力会显著增加。

3.3.3 解决策略

缓存预热：重启后通过脚本提前加载高频访问文件到页缓存，如cat /data/high_freq_file > /dev/null（简单场景），或使用专业工具（如vmtouch）进行精细化预热；
分层缓存：引入持久化缓存中间件（如Redis），将高频访问的热点数据存储在Redis中，避免依赖页缓存的临时存储；
滚动重启：集群场景下采用滚动重启方式，避免所有节点同时处于缓存冷启动状态，保障整体服务稳定性。

四、页缓存优化实战策略

4.1 基于业务场景的预读优化

|-----------------------|--------------|-------------|----------------------------------------------|
| 业务场景 | 访问特征 | 预读大小建议 | 配置命令 |
| 大文件下载（如视频、备份） | 顺序读，单次访问大文件 | 128KB-512KB | blockdev --setra 256 /dev/sda（256×512=128KB） |
| 数据库（MySQL/PostgreSQL） | 随机读，小数据块频繁访问 | 16KB-64KB | blockdev --setra 32 /dev/sda（32×512=16KB） |
| Web服务器（Nginx/Apache） | 混合读，中小静态文件为主 | 64KB-128KB | blockdev --setra 128 /dev/sda（128×512=64KB） |

4.2 内核参数精细化调优

核心优化参数配置（编辑/etc/sysctl.conf，执行sysctl -p生效）：

vm.dirty_ratio = 15：脏页占总内存15%时，进程同步回写脏页（避免脏页过多）；
vm.dirty_background_ratio = 5：脏页占比5%时，后台线程异步回写；
vm.dirty_expire_centisecs = 1500：脏页超时15秒（1500厘秒）后强制回写；
vm.swappiness = 30：内存不足时，优先回收30%的缓存空间而非使用swap；
vm.min_free_kbytes = 65536：保留64MB最小空闲内存，保障内核正常运行。

4.3 监控体系搭建

建立页缓存监控指标，及时发现异常：

基础指标：通过free -h监控buff/cache占用率，iostat监控磁盘I/O；
内核指标：通过/proc/vmstat监控页缓存加载（pgpgin）、回收（pgsteal_kswapd）、脏页（nr_dirty）等指标；
可视化监控：通过Prometheus+Grafana部署监控，配置页缓存相关指标的告警规则（如缓存命中率低于70%、脏页占比超过20%时告警）。

五、总结

页缓存作为Linux服务器提升磁盘I/O性能的核心机制，其优化的关键在于"匹配业务访问特征"------顺序读场景增大预读、随机读场景减小预读，同时通过内核参数平衡缓存占用与内存回收效率。运维人员需深入理解其加载、淘汰、回写机制，结合/proc文件系统和系统工具排查问题，通过缓存预热、参数调优、监控告警等手段，最大化发挥页缓存的性能价值，避免因缓存使用不当导致的I/O瓶颈或OOM风险。

六、附录：常用工具与命令

free -h：查看内存及缓存占用情况；
iostat -x 1：实时监控磁盘I/O性能；
cat /proc/vmstat | grep pg：查看页缓存相关内核统计；
blockdev --getra/--setra：查看/设置磁盘预读大小；
sync && echo 3 > /proc/sys/vm/drop_caches：临时回收页缓存；
vmtouch：专业的页缓存预热与管理工具。