MySQL的深度分页及相关概念

那起舞的日子2026-01-28 10:26

一、业务场景

mysql查询数据，数据量过大（百万级以上），分页查询数据的时候，比如每页1000条，到limit 5000000 1000的时候，就会很慢。为啥？怎么解决呢？

原因是：mysql底层会把前500w条数据都会回表查询，回表查询如果没有覆盖索引的话，那么本质是IO操作，即从磁盘里根据主键获取所有列的值，这个过程导致慢。

如何解决？

1、游标分页

前端传下lastId，我们根据前端传下来的这个参数直接在sql层利用lastId>的数据来查；（舍弃框架层比如mybatis-plus自带的底层是limit offset,pageSize 这种方式）；

2、先查主键，在根据主键查对应的值。

避免回表。

3、其他方案？待完善

主要看以下几个参考文档，写得不错，这里就不在赘述。

索引：

聚簇索引、非聚簇索引、覆盖索引

聚簇索引：主键所以，primary key

非聚簇索引（二级索引）：非主键索引，比如：唯一索引(unique index)、组合索引

覆盖索引：建立索引的字段和select 查询的字段一致，查询的时候不需要回表。这样的索引称之为覆盖索引。

回表： mysql查询时，先在索引树种根据已建立的索引查找到匹配到指定值的范围数据（ids），在根据ids(主键)去聚簇索引里查这行数据的所有列（这些数据是在磁盘上的，.ibd格式的文件，属于IO操作，耗时）。

索引下推 (ICP- Index Condition PushDown )：

在索引查询过程，先根据索引过滤掉大部分数据（索引建立要和查询条件一致，才能准确过滤和下推），避免大量无效数据回表，需要注意触发条件，可通过explain的Extra检测。