mysql深分页性能瓶颈根源分析

MySQL 深分页为什么慢?

LIMIT m,n 会扫描并丢弃前 m 条数据,页码越大越慢。
怎么优化?

1️⃣ 建索引

2️⃣ 子查询先查 ID

3️⃣ 游标分页(id > 上页最大值

4️⃣ 业务限制最大页数

MySQL深分页性能下降的根本原因在于LIMIT offset, size语句的执行机制。其核心流程是:

limit 必须从头逐行扫描,然后跳过offset行。offset越大,无效扫描量线性上涨,性能就断崖式下跌。

具体来说,一个典型的深分页查询SELECT * FROM table ORDER BY id LIMIT 100000, 10;的执行过程如下:

  1. 通过索引(如主键索引)或全表扫描,定位到符合条件的数据起始位置。
  2. 顺序扫描前100,000条记录。
  3. 将这100,000条记录丢弃
  4. 返回接下来的10条记录。

这个过程导致了两个主要的性能瓶颈:

  • 巨大的无效I/O与CPU开销:即使只需要最后10条数据,引擎也必须读取、解析并丢弃前100,000条记录的所有数据页,造成了大量的磁盘I/O和CPU计算浪费。
  • 回表与锁竞争加剧:如果查询无法被覆盖索引完全满足,在通过二级索引定位到主键ID后,还需要进行大量的"回表"操作来获取完整行数据。在事务隔离级别较高(如RR)时,长时间扫描大量数据还可能加剧锁竞争,影响并发性能。

为了更清晰地对比不同优化方案的特性,下表汇总了主流解决方案:

优化方案 核心原理 是否支持跳页 性能影响 适用场景
游标分页 (Cursor-based) 使用WHERE id > last_max_id LIMIT size,避免OFFSET ⭐⭐⭐⭐⭐ (最优) 无限滚动、连续翻页(如App信息流)。
延迟关联 (Deferred Join) 子查询先利用覆盖索引快速获取目标页的主键ID,再通过JOIN回表取数据,减少回表量。 ⭐⭐⭐⭐ (很好) 中大型表,排序字段有索引,且需要支持跳页。
覆盖索引优化 创建包含所有查询字段的覆盖索引,使查询仅扫描索引即可完成,避免回表。 ⭐⭐⭐⭐ (很好) 查询字段较少,可以建立覆盖索引的场景。
业务层限制 产品层面限制可查询的最大页码或深度(如只允许查前100页)。 ⭐⭐⭐⭐⭐ (最优) 所有分页场景,作为兜底方案。

代码示例:延迟关联优化

将原始的低效深分页查询:

sql 复制代码
-- 原始低效查询
SELECT * FROM `order` ORDER BY create_time DESC LIMIT 100000, 10;

优化为延迟关联查询:

sql 复制代码
-- 优化后的延迟关联查询
SELECT o.* 
FROM `order` o
JOIN (
    SELECT id -- 子查询只选取主键ID,利用(create_time, id)索引高效定位
    FROM `order` 
    ORDER BY create_time DESC 
    LIMIT 100000, 10
) AS t ON o.id = t.id; -- 通过主键快速关联回表获取完整数据

此优化利用了(create_time, id)联合索引的有序性,子查询可以快速地在索引树上定位到第100000条记录之后的位置,只读取10个ID,然后通过主键精准回表,极大地减少了需要扫描和回表的数据量。


参考来源

相关推荐
倔强的石头_19 小时前
《Kingbase护城河》——猎捕慢查询:执行计划的微观解析与索引调优实战
数据库
SelectDB21 小时前
Apache Doris Python UDF:让 SQL 直接调用 Python 生态,支撑 Agent 时代复杂业务逻辑
大数据·数据库·python
jiayou642 天前
KingbaseES 表级与列级加密完全指南
数据库·后端
GBASE3 天前
G术时刻 |GBase 8s数据库事务并发控制之封锁技术介绍(下)
数据库
xiezhr3 天前
逛GitHub发现了一款免费的带AI功能的数据库管理工具
数据库·ai编程·dba
唐青枫4 天前
MySQL JSON 实战详解:从存储、查询、更新到 JSON_TABLE 与索引
sql·mysql
吃糖的小孩4 天前
给 QQ AI 机器人设计“可控记忆”:会话摘要、手动长期记忆与角色卡边界
数据库
小满8784 天前
5.Mysql事务隔离级别与锁机制
mysql
笃行3505 天前
金仓数据库数据安全双防线:静态存储加密与传输加密实战
数据库
笃行3505 天前
金仓数据库物理备份实战:sys_rman 全流程演练与误覆盖抢救
数据库