深入理解 MySQL InnoDB Buffer Pool 的 LRU 冷热数据机制

本文深入剖析 MySQL InnoDB 存储引擎如何通过定制化的 LRU 链表管理 Buffer Pool 中的冷热数据，有效解决缓冲池污染问题，保障数据库在高并发 CRUD 场景下的性能稳定。

[一、引言：为什么需要定制化的 LRU？](#一、引言：为什么需要定制化的 LRU？)
[二、MySQL LRU 链表的结构](#二、MySQL LRU 链表的结构)
三、核心流程图
四、三大核心机制详解
五、关键配置参数
六、整体数据流动示意
[七、Buffer Pool 全景视角](#七、Buffer Pool 全景视角)
八、性能监控与调优
[九、常见问题 FAQ](#九、常见问题 FAQ)
十、总结

一、引言：为什么需要定制化的 LRU？

在 MySQL 的 InnoDB 存储引擎中，Buffer Pool（缓冲池） 是用于缓存数据页的内存区域，是提升数据库性能的核心组件。当执行 CRUD 操作时，数据页需要不断从磁盘读取并加载到 Buffer Pool 中。

如果采用传统的 LRU（Least Recently Used，最近最少使用） 算法，会面临一个严重问题：缓冲池污染（Buffer Pool Pollution）。

1.1 传统 LRU 的困境

传统 LRU 的规则很简单：新读取的页放在链表头部，最近访问的页移到头部，长时间未访问的页逐渐沉到尾部并被淘汰。

问题场景 ：当执行 SELECT * FROM t 全表扫描，或进行备份操作时，会一次性将大量很少被再次访问的数据页加载到 Buffer Pool。这些"冷"数据会占据链表头部，把原本频繁访问的"热"数据挤到尾部甚至淘汰出内存，导致后续业务查询性能急剧下降。

解决方案 ：MySQL 对 LRU 链表进行了定制化改造，实现了冷热数据分离的设计思想。

二、MySQL LRU 链表的结构

MySQL 的 LRU 链表并非简单的线性结构 ，而是被一个称为 MidPoint（中点） 的位置分割成两个子链表：

复制代码

┌─────────────────────────────────────┐
│         New Sublist (Young)          │  ← 热数据区，约 5/8
│  Head ──────────────────── Tail      │
├─────────────────────────────────────┤  ← MidPoint
│         Old Sublist (Old)            │  ← 冷数据区，约 3/8
│  Head ──────────────────── Tail      │
└─────────────────────────────────────┘

区域	占比	存储内容
New Sublist	约 5/8 (63%)	频繁访问的 Young Page（热数据）
Old Sublist	约 3/8 (37%)	较少访问的 Old Page（冷数据）

三、核心流程图

3.1 数据页在 Buffer Pool 中的完整生命周期

Buffer Pool LRU 链表
磁盘
Old Sublist (3/8)
New Sublist (5/8)
① Midpoint 插入策略
② 再次访问且停留时间 > innodb_old_blocks_time
③ 未访问的页逐渐老化
④ 淘汰
数据页在磁盘
Head
Young Pages
Tail
Head / MidPoint
Old Pages
Tail
Evicted 释放空间

3.2 数据页插入流程（Midpoint Insertion Strategy）

是
否
从磁盘读取新数据页
Buffer Pool 有空间?
插入到 Old Sublist 的 Head

即 MidPoint 位置
从 Old Sublist Tail 淘汰页
页进入冷数据区等待

关键点 ：新页不会直接插入到整个 LRU 链表的头部，而是插入到 Old Sublist 的头部（MidPoint），避免一次性大量加载的冷数据污染热数据区。

3.3 页访问时的提升与优化逻辑

New Sublist
是
否
Old Sublist
是
否
页被访问
页在哪个区域?
是否在 New 区前 1/4?
不移动 - 减少锁竞争
移动到 New Sublist Head
停留时间 > innodb_old_blocks_time?
提升到 New Sublist Head
保持在 Old Sublist

防止全表扫描污染
访问完成

四、三大核心机制详解

4.1 Midpoint 插入策略

当 InnoDB 从磁盘读取新页到 Buffer Pool 时，采用 Midpoint Insertion（中点插入） 策略：

插入位置 ：Old Sublist 的 Head（即整个 LRU 链表的 MidPoint）
目的：防止全表扫描、备份等一次性加载的大量冷数据直接占据链表头部，保护热数据不被挤出

4.2 冷页提升机制（Promotion）

正常情况：当访问 Old Sublist 中的缓存页时，该页会被提升到 New Sublist 的 Head，成为热数据。

扫描保护 ：当通过 SELECT * FROM t 将大批数据加载到 Old Sublist 后，如果在不到 1 秒 内再次访问这些页，这些被访问的页不会被提升为热数据。

控制参数 ：innodb_old_blocks_time（默认 1000ms）
原理：页必须在 Old Sublist 中停留超过该时间后，再次被访问才会触发提升
效果：全表扫描产生的"一次性"访问不会污染热数据区

4.3 New Sublist 访问优化

对于已经在 New Sublist 中的页，InnoDB 做了进一步优化：

规则：如果访问的是 New Sublist 前 1/4 的页，不会将其移动到 LRU 链表头部
原因：这些页本身就是最热的数据，频繁移动会增加链表指针更新和 Mutex 竞争的开销
收益：降低对最热数据的维护成本，提升并发性能

五、关键配置参数

5.1 innodb_old_blocks_pct

控制 Old Sublist 占整个 LRU 链表的比例。

sql 复制代码

-- 查看当前配置
SHOW VARIABLES LIKE '%innodb_old_blocks_pct%';

参数值	含义
默认 37	Old Sublist 约占 37%（约 3/8），New Sublist 约占 63%（约 5/8）
可调范围	5 ~ 95

提示：用户可根据业务负载特点动态调整此参数，例如读多写少场景可适当增大 New 区比例。

5.2 innodb_old_blocks_time

控制页在 Old Sublist 中停留多久后，再次被访问才能提升到 New Sublist。

参数值	含义
默认 1000	1000 毫秒（1 秒）
设为 0	禁用时间检查，每次访问 Old 区页都会立即提升（可能增加污染风险）

适用场景：存在大量全表扫描或大范围扫描时，建议保持默认或适当调大，以增强缓冲池抗污染能力。

六、整体数据流动示意

数据流动
📥 新页从磁盘读入

→ 插入 Old Sublist Head (Midpoint)
⬆️ 被访问的 Old 页

→ 满足时间条件后提升到 New Sublist Head
⬇️ 未访问的 New 页

→ 逐渐老化下沉到 Old Sublist
🗑️ Old Sublist Tail 的页

→ 空间不足时被淘汰

七、Buffer Pool 全景视角

7.1 Buffer Pool 整体架构

LRU 链表只是 Buffer Pool 管理机制的一部分。InnoDB Buffer Pool 的完整架构如下：
链表管理
Buffer Pool 实例
Chunk (128MB)
Page Frame 1
Page Frame 2
...
Page Frame N
LRU List

冷热数据管理
Flush List

脏页管理
Free List

空闲页

组件	说明
Page	默认 16KB，InnoDB 与磁盘交互的基本单位
Chunk	128MB 为单位申请内存，便于动态调整 Buffer Pool 大小
LRU List	管理所有已缓存页的冷热顺序（本文核心）
Flush List	按修改时间排序的脏页链表，用于刷盘
Free List	空闲页链表，新页从此获取 Frame

注意：一个页可以同时存在于 LRU List 和 Flush List 中（脏页），两者职责不同。

7.2 预读机制与 LRU 的协同

InnoDB 的预读（Read-Ahead） 会提前将可能访问的页加载到 Buffer Pool，这些页同样遵循 Midpoint 插入策略：

预读类型	触发条件	与 LRU 的关系
线性预读	顺序访问某个区（Extent）内连续 56 个页	预读的页插入 Old Sublist Head，避免预读失败污染热区
随机预读	同一区内 13 个页被访问	同上，预读页从冷区入口进入

预读 + Midpoint 插入 = 即使预读不准确，也不会把真正的热数据挤出。

7.3 与其他系统的 LRU 对比

系统	LRU 策略	特点
MySQL InnoDB	冷热分离 + 时间窗口	抗全表扫描污染，可配置
Redis	近似 LRU（采样淘汰）	内存受限，采样减少开销
Linux Page Cache	双链表 LRU（Active/Inactive）	类似冷热分离思想
PostgreSQL	无全局 LRU	依赖 OS Page Cache，策略不同

可见"冷热分离"是应对扫描类负载的通用设计思路。

八、性能监控与调优

8.1 关键监控指标

sql 复制代码

-- 1. Buffer Pool 命中率（越高越好，建议 > 99%）
SELECT 
  (1 - (Innodb_buffer_pool_reads / Innodb_buffer_pool_read_requests)) * 100 AS hit_ratio
FROM performance_schema.global_status 
WHERE VARIABLE_NAME IN ('Innodb_buffer_pool_reads', 'Innodb_buffer_pool_read_requests');

-- 2. LRU 相关状态
SHOW ENGINE INNODB STATUS\G
-- 查看 BUFFER POOL AND MEMORY 段中的 pages made young/not young 等

-- 3. 当前 Buffer Pool 配置
SHOW VARIABLES LIKE 'innodb_buffer_pool%';

指标	含义
`Innodb_buffer_pool_reads`	从磁盘读取的页数
`Innodb_buffer_pool_read_requests`	逻辑读请求总数
`pages made young`	从 Old 提升到 New 的页数
`pages not made young`	因 `innodb_old_blocks_time` 未提升的页数

8.2 调优决策流程图

是
是
否
否
是
否
Buffer Pool 性能问题
命中率低?
存在大量全表扫描?
增大 innodb_old_blocks_time

如 2000~3000ms
增大 innodb_buffer_pool_size

或 innodb_old_blocks_pct 调小
pages not young 很多?
全表扫描多，考虑优化 SQL

或调大 innodb_old_blocks_time
整体健康，关注其他瓶颈

8.3 实战调优建议

场景	建议
OLTP 高并发	保持默认，关注 `innodb_buffer_pool_size` 是否足够
报表/分析型查询多	适当增大 `innodb_old_blocks_time`，减少扫描污染
混合负载	可尝试 `innodb_old_blocks_pct=30` 略增热区比例
Buffer Pool 预热	重启后执行 `SELECT * FROM 核心表` 或使用 `innodb_buffer_pool_dump_at_shutdown` 预热

九、常见问题 FAQ

Q1：为什么我的热数据还是被挤出去了？

可能原因：

Buffer Pool 太小 ：innodb_buffer_pool_size 建议设为物理内存的 60%~80%
全表扫描过多：检查慢查询，优化索引或拆分大表
innodb_old_blocks_time 过小：扫描产生的页在 1 秒内被"误提升"

Q2：多实例 Buffer Pool 时 LRU 如何工作？

从 MySQL 5.5+ 起支持 innodb_buffer_pool_instances，每个实例有独立的 LRU、Flush、Free 链表，减少锁竞争，LRU 逻辑在每个实例内相同。

Q3：MySQL 8.0 有改进吗？

MySQL 8.0 对 Buffer Pool 的改进主要在：

支持在线调整 innodb_buffer_pool_size（无需重启）
更好的 Chunk 管理
LRU 冷热分离的核心算法保持稳定

十、总结

MySQL InnoDB 通过定制化的 LRU 链表，实现了冷热数据分离，有效解决了传统 LRU 的缓冲池污染问题：

机制	作用
Midpoint 插入	新页从冷区入口进入，避免一次性加载污染热区
时间窗口提升	`innodb_old_blocks_time` 防止全表扫描页被误判为热数据
前 1/4 不移动	减少对最热数据的链表维护开销
比例可配置	`innodb_old_blocks_pct` 支持按业务调优

这种设计在保证热数据常驻内存的同时，让冷数据有"试用期"，只有真正被频繁访问的页才能晋升为热数据，从而在高并发 CRUD 场景下维持数据库的稳定高性能。

深入理解 MySQL InnoDB Buffer Pool 的 LRU 冷热数据机制