Mysql深分页的解决方案

在数据量非常大的情况下,深分页查询则变得很常见,深分页会导致MySQL需要扫描大量前面的数据,从而效率低下。例如,使用LIMIT 100000, 10时,MySQL需要扫描前100000条数据才能找到第10000页的数据。

在MySQL中解决深分页问题,可通过以下5种优化方案实现:

方案一:延迟关联 (Deferred Join)

原理:先通过子查询获取主键,再关联原表获取完整数据

通常我们直接查询分页较大的数据速率较慢,我们可以选择优先查询主键列,因为其可以通过索引查询且速度最快,然后根据获取的主键匹配对应的数据。

sql 复制代码
SELECT t.* 
FROM user t
INNER JOIN (
SELECT id 
FROM user 
ORDER BY sort_field 
LIMIT 100000, 10
) AS tmp ON t.id = tmp.id;

方案二:有序唯一键分页 (Cursor-based Pagination)

要求:表中存在有序唯一键(如自增ID)

这种方法的原理就是我们在进行范围查询后需要记录页尾的行号,当查询以行号开始的范围数据时直接根据行号匹配,避免了扫描前面的数据。

sql 复制代码
-- 假设已知上一页最后一条记录的id为12345
SELECT * 
FROM user 
WHERE id > 12345 
ORDER BY id 
LIMIT 10;

方案三:书签分页 (Bookmark Pagination)

原理:记录上一页最后一条数据的排序字段值

sql 复制代码
-- 假设按create_time排序,上一页最后记录的create_time为'2023-01-01 12:00:00'
SELECT * 
FROM user 
WHERE create_time > '2023-01-01 12:00:00' 
ORDER BY create_time 
LIMIT 10;

方案四:预估分页 (Approximate Pagination)

适用场景:允许误差的近似分页

适用于数据量极大的场景,即主键也不再进行分页查询,而是通过预估得到大致行号的范围,再通过主键匹配数据行(此方案可能会有误差,需要根据场景选择)

sql 复制代码
-- 先获取预估偏移量
SELECT COUNT(*) 
FROM user 
WHERE sort_field < {target_value};


-- 再使用延迟关联获取精确数据
SELECT t.* 
FROM user t
INNER JOIN (
SELECT id 
FROM user 
WHERE sort_field < {target_value} 
ORDER BY sort_field 
LIMIT 10
) AS tmp ON t.id = tmp.id;

方案五:缓存优化 (Caching)

适用场景:高频访问的固定排序分页

  1. 对常用排序方式预生成分页结果
  2. 使用Redis等缓存中间结果
  3. 查询时优先读取缓存数据

性能对比(100万数据测试):

方案 传统LIMIT 延迟关联 有序唯一键 书签分页
1000页查询耗时 2.3s 420ms 8ms 12ms
内存占用

最佳实践建议:

  1. 优先使用有序唯一键分页(如自增ID),时间复杂度从O(n)降至O(1)
  2. 对高频查询的排序字段建立索引
  3. 结合业务场景选择方案:
    • 实时性要求高 → 方案二/三
    • 数据量极大 → 方案四/五
    • 允许误差 → 方案四
  4. 对超过10万条数据的分页需求,建议改用滚动加载(无限下拉)模式
相关推荐
皮影w7 分钟前
Java SpringAOP入门
java·开发语言
007php00710 分钟前
Redis面试题解析:Redis的数据过期策略
java·网络·redis·缓存·面试·职场和发展·php
w***488234 分钟前
Spring Boot3.x集成Flowable7.x(一)Spring Boot集成与设计、部署、发起、完成简单流程
java·spring boot·后端
u***1371 小时前
详解tomcat中的jmx监控
java·tomcat
Vic101011 小时前
Java 序列化与反序列化:深入解析与实践
java·开发语言
后端小张1 小时前
【JAVA 进阶】Spring Cloud 微服务全栈实践:从认知到落地
java·开发语言·spring boot·spring·spring cloud·微服务·原理
李昊哲小课1 小时前
SSM框架完整教程
spring boot·spring·spring cloud
zl9798991 小时前
RabbitMQ-发布确认高级
java·分布式·rabbitmq
灰小猿1 小时前
分布式项目集成TLog实现轻量级日志链路追踪
java·分布式·springcloud·tlog·日志链路追踪
乄bluefox1 小时前
高性能分布式 ID 生成器:基于 Redis Segment 预分配的实践
java·redis·分布式