分页为什么越翻越慢:offset 陷阱、seek 分页与索引排序优化

目标:你能把"分页慢"讲成一个可解释的 IO 模型,并掌握可落地的改造:seek 分页、覆盖索引、延迟关联。

1. offset 分页的本质:扫描 + 丢弃

经典写法:

sql 复制代码
select *
from t
where user_id = ?
order by create_time desc
limit 100000, 20;

直觉:

  • MySQL 必须先找到前 100000 行(满足 where + order 的结果)
  • 然后丢弃,再返回 20 行

这意味着:

  • 页码越大,被丢弃的行越多
  • 扫描成本线性增长

1.1 一个可复现的最小例子:同一张表对比 offset 与 seek 的 EXPLAIN

准备表:

sql 复制代码
create table t_order (
  id bigint primary key,
  user_id bigint not null,
  create_time datetime not null,
  title varchar(64) not null,
  content varchar(2000) not null,
  key idx_user_time (user_id, create_time, id, title)
);

对比两条查询。

对照 1:offset 分页(越翻越慢)

sql 复制代码
explain
select *
from t_order
where user_id = 1
order by create_time desc, id desc
limit 10000, 20;

你要重点观察:

  • rows 是否显著变大
  • 是否发生大量回表(select *Extra 不会 Using index

对照 2:seek 分页(稳定)

sql 复制代码
explain
select id, title, create_time
from t_order
where user_id = 1
  and (create_time < ? or (create_time = ? and id < ?))
order by create_time desc, id desc
limit 20;

你要重点观察:

  • rows 不随页码线性增长
  • 更容易出现 Using index(覆盖)

2. 即使走索引,也会慢:因为"走的是长距离顺扫"

如果索引是 (user_id, create_time)

  • 能按顺序找到记录
  • 但仍需要向后移动 100000 步才能到达起点

如果还 select *

  • 会回表 100020 次(或接近)
  • 随机 IO/缓存失效进一步放大

3. seek 分页:把"跳过"变成"从游标继续"

思路:

  • 用上一页最后一条记录的排序键作为游标
  • 下一页从游标之后继续取

示例:

sql 复制代码
select *
from t
where user_id = ?
  and (create_time < ?)
order by create_time desc
limit 20;

如果存在同时间戳并发写入,建议加 tie-breaker:

sql 复制代码
where user_id=?
  and (create_time < ? or (create_time = ? and id < ?))
order by create_time desc, id desc
limit 20;

对应索引:

  • (user_id, create_time, id)

优势:

  • 不随页码变慢
  • 能稳定利用索引有序性

3.1 对照组:只用 create_time 做游标可能不稳定

如果你的数据里存在相同时间戳:

  • 错:只用 create_time < lastTime,可能出现漏数据/重复数据
  • 对:加 tie-breaker(create_time 相等时用 id

4. 覆盖索引 + 延迟关联:解决回表放大

4.1 列表页优先覆盖索引

如果列表只需要少量列:

  • 让索引覆盖返回列
  • Extra: Using index

4.2 必须返回全字段:用延迟关联压缩回表次数

sql 复制代码
select *
from t
where id in (
  select id
  from t
  where user_id=?
  order by create_time desc
  limit 20
);

目的:

  • 内层只拿 20 个 id
  • 外层只回表 20 次

对照点:延迟关联只解决"回表次数",不解决 offset 的"扫描丢弃"。

  • 页码很深时:优先 seek 分页
  • 页码不深但 select * 很重:延迟关联收益明显

5. 排序为什么会慢:filesort 与临时表

where 用的索引与 order by 不一致:

  • MySQL 可能先过滤再排序
  • 触发 Using filesort

优化:

  • 让联合索引同时满足 where + order
  • 让排序字段方向一致(desc/asc)

6. 线上排查 checklist

  • 是否大 offset:limit 100000, 20
  • EXPLAIN:
    • rows 是否随页码增长
    • Extra 是否 Using filesort/temporary
    • 是否 Using index(覆盖)
  • 是否 select * 导致回表放大

6.1 更流程化的排查顺序(从现象到动作)

  1. 确认现象
    • 是否"页码越大越慢"
  2. 用 EXPLAIN 看 3 个指标
    • rows 是否随 offset 增长
    • Extra 是否 Using filesort/temporary
    • 是否覆盖索引 Using index
  3. 按根因选方案
    • offset 导致的扫描丢弃:改 seek 分页
    • 回表放大:覆盖索引或延迟关联
    • 排序代价:调整联合索引让 where+order 同索引
相关推荐
寂夜了无痕4 小时前
MySQL 主从延迟全链路根因诊断与破局法则
数据库·mysql·mysql主从延迟
APguantou4 小时前
NCRE-三级数据库技术-第12章-备份与数据库恢复
数据库·sqlserver
Bat U4 小时前
MySQL数据库|表设计+新增+分组查询
数据库·mysql
麦聪聊数据4 小时前
企业数据流通与敏捷API交付实战(五):异构数据跨库联邦与零代码发布
数据库·sql·低代码·restful
Elastic 中国社区官方博客4 小时前
当 TSDS 遇到 ILM:设计不会拒绝延迟数据的时间序列数据流
大数据·运维·数据库·elasticsearch·搜索引擎·logstash
qing222222224 小时前
Linux中修改mysql数据表
linux·运维·mysql
Omics Pro4 小时前
虚拟细胞:开启HIV/AIDS治疗新纪元的关键?
大数据·数据库·人工智能·深度学习·算法·机器学习·计算机视觉
J2虾虾5 小时前
MySQL的基本操作
数据库·mysql
arvin_xiaoting5 小时前
OpenClaw学习总结_III_自动化系统_3:CronJobs详解
数据库·学习·自动化