分页为什么越翻越慢:offset 陷阱、seek 分页与索引排序优化

目标:你能把"分页慢"讲成一个可解释的 IO 模型,并掌握可落地的改造:seek 分页、覆盖索引、延迟关联。

1. offset 分页的本质:扫描 + 丢弃

经典写法:

sql 复制代码
select *
from t
where user_id = ?
order by create_time desc
limit 100000, 20;

直觉:

  • MySQL 必须先找到前 100000 行(满足 where + order 的结果)
  • 然后丢弃,再返回 20 行

这意味着:

  • 页码越大,被丢弃的行越多
  • 扫描成本线性增长

1.1 一个可复现的最小例子:同一张表对比 offset 与 seek 的 EXPLAIN

准备表:

sql 复制代码
create table t_order (
  id bigint primary key,
  user_id bigint not null,
  create_time datetime not null,
  title varchar(64) not null,
  content varchar(2000) not null,
  key idx_user_time (user_id, create_time, id, title)
);

对比两条查询。

对照 1:offset 分页(越翻越慢)

sql 复制代码
explain
select *
from t_order
where user_id = 1
order by create_time desc, id desc
limit 10000, 20;

你要重点观察:

  • rows 是否显著变大
  • 是否发生大量回表(select *Extra 不会 Using index

对照 2:seek 分页(稳定)

sql 复制代码
explain
select id, title, create_time
from t_order
where user_id = 1
  and (create_time < ? or (create_time = ? and id < ?))
order by create_time desc, id desc
limit 20;

你要重点观察:

  • rows 不随页码线性增长
  • 更容易出现 Using index(覆盖)

2. 即使走索引,也会慢:因为"走的是长距离顺扫"

如果索引是 (user_id, create_time)

  • 能按顺序找到记录
  • 但仍需要向后移动 100000 步才能到达起点

如果还 select *

  • 会回表 100020 次(或接近)
  • 随机 IO/缓存失效进一步放大

3. seek 分页:把"跳过"变成"从游标继续"

思路:

  • 用上一页最后一条记录的排序键作为游标
  • 下一页从游标之后继续取

示例:

sql 复制代码
select *
from t
where user_id = ?
  and (create_time < ?)
order by create_time desc
limit 20;

如果存在同时间戳并发写入,建议加 tie-breaker:

sql 复制代码
where user_id=?
  and (create_time < ? or (create_time = ? and id < ?))
order by create_time desc, id desc
limit 20;

对应索引:

  • (user_id, create_time, id)

优势:

  • 不随页码变慢
  • 能稳定利用索引有序性

3.1 对照组:只用 create_time 做游标可能不稳定

如果你的数据里存在相同时间戳:

  • 错:只用 create_time < lastTime,可能出现漏数据/重复数据
  • 对:加 tie-breaker(create_time 相等时用 id

4. 覆盖索引 + 延迟关联:解决回表放大

4.1 列表页优先覆盖索引

如果列表只需要少量列:

  • 让索引覆盖返回列
  • Extra: Using index

4.2 必须返回全字段:用延迟关联压缩回表次数

sql 复制代码
select *
from t
where id in (
  select id
  from t
  where user_id=?
  order by create_time desc
  limit 20
);

目的:

  • 内层只拿 20 个 id
  • 外层只回表 20 次

对照点:延迟关联只解决"回表次数",不解决 offset 的"扫描丢弃"。

  • 页码很深时:优先 seek 分页
  • 页码不深但 select * 很重:延迟关联收益明显

5. 排序为什么会慢:filesort 与临时表

where 用的索引与 order by 不一致:

  • MySQL 可能先过滤再排序
  • 触发 Using filesort

优化:

  • 让联合索引同时满足 where + order
  • 让排序字段方向一致(desc/asc)

6. 线上排查 checklist

  • 是否大 offset:limit 100000, 20
  • EXPLAIN:
    • rows 是否随页码增长
    • Extra 是否 Using filesort/temporary
    • 是否 Using index(覆盖)
  • 是否 select * 导致回表放大

6.1 更流程化的排查顺序(从现象到动作)

  1. 确认现象
    • 是否"页码越大越慢"
  2. 用 EXPLAIN 看 3 个指标
    • rows 是否随 offset 增长
    • Extra 是否 Using filesort/temporary
    • 是否覆盖索引 Using index
  3. 按根因选方案
    • offset 导致的扫描丢弃:改 seek 分页
    • 回表放大:覆盖索引或延迟关联
    • 排序代价:调整联合索引让 where+order 同索引
相关推荐
唐青枫1 小时前
MySQL JSON 实战详解:从存储、查询、更新到 JSON_TABLE 与索引
sql·mysql
吃糖的小孩2 小时前
给 QQ AI 机器人设计“可控记忆”:会话摘要、手动长期记忆与角色卡边界
数据库
小满8782 小时前
5.Mysql事务隔离级别与锁机制
mysql
笃行35019 小时前
金仓数据库数据安全双防线:静态存储加密与传输加密实战
数据库
笃行35019 小时前
金仓数据库物理备份实战:sys_rman 全流程演练与误覆盖抢救
数据库
笃行35020 小时前
金仓数据库逻辑备份实战:从全库导出到 Schema 替换的完整闭环
数据库
元Y亨H20 小时前
技术笔记:MySQL 字符集排序规则与大小写敏感性问题解决方案
mysql
SelectDB2 天前
阶跃星辰基于 SelectDB 构建 PB 级 Agent 可观测平台
大数据·数据库·aigc
这个DBA有点耶2 天前
GROUP BY优化全解:如何写出既不丢数据又飞快的分组查询
数据库·mysql·架构