Mysql深分页的解决方案

在数据量非常大的情况下,深分页查询则变得很常见,深分页会导致MySQL需要扫描大量前面的数据,从而效率低下。例如,使用LIMIT 100000, 10时,MySQL需要扫描前100000条数据才能找到第10000页的数据。

在MySQL中解决深分页问题,可通过以下5种优化方案实现:

方案一:延迟关联 (Deferred Join)

原理:先通过子查询获取主键,再关联原表获取完整数据

通常我们直接查询分页较大的数据速率较慢,我们可以选择优先查询主键列,因为其可以通过索引查询且速度最快,然后根据获取的主键匹配对应的数据。

sql 复制代码
SELECT t.* 
FROM user t
INNER JOIN (
SELECT id 
FROM user 
ORDER BY sort_field 
LIMIT 100000, 10
) AS tmp ON t.id = tmp.id;

方案二:有序唯一键分页 (Cursor-based Pagination)

要求:表中存在有序唯一键(如自增ID)

这种方法的原理就是我们在进行范围查询后需要记录页尾的行号,当查询以行号开始的范围数据时直接根据行号匹配,避免了扫描前面的数据。

sql 复制代码
-- 假设已知上一页最后一条记录的id为12345
SELECT * 
FROM user 
WHERE id > 12345 
ORDER BY id 
LIMIT 10;

方案三:书签分页 (Bookmark Pagination)

原理:记录上一页最后一条数据的排序字段值

sql 复制代码
-- 假设按create_time排序,上一页最后记录的create_time为'2023-01-01 12:00:00'
SELECT * 
FROM user 
WHERE create_time > '2023-01-01 12:00:00' 
ORDER BY create_time 
LIMIT 10;

方案四:预估分页 (Approximate Pagination)

适用场景:允许误差的近似分页

适用于数据量极大的场景,即主键也不再进行分页查询,而是通过预估得到大致行号的范围,再通过主键匹配数据行(此方案可能会有误差,需要根据场景选择)

sql 复制代码
-- 先获取预估偏移量
SELECT COUNT(*) 
FROM user 
WHERE sort_field < {target_value};


-- 再使用延迟关联获取精确数据
SELECT t.* 
FROM user t
INNER JOIN (
SELECT id 
FROM user 
WHERE sort_field < {target_value} 
ORDER BY sort_field 
LIMIT 10
) AS tmp ON t.id = tmp.id;

方案五:缓存优化 (Caching)

适用场景:高频访问的固定排序分页

  1. 对常用排序方式预生成分页结果
  2. 使用Redis等缓存中间结果
  3. 查询时优先读取缓存数据

性能对比(100万数据测试):

方案 传统LIMIT 延迟关联 有序唯一键 书签分页
1000页查询耗时 2.3s 420ms 8ms 12ms
内存占用

最佳实践建议:

  1. 优先使用有序唯一键分页(如自增ID),时间复杂度从O(n)降至O(1)
  2. 对高频查询的排序字段建立索引
  3. 结合业务场景选择方案:
    • 实时性要求高 → 方案二/三
    • 数据量极大 → 方案四/五
    • 允许误差 → 方案四
  4. 对超过10万条数据的分页需求,建议改用滚动加载(无限下拉)模式
相关推荐
从零开始学习人工智能2 分钟前
Feign 重试策略调整:优化微服务通信的稳定性
java·微服务·架构
coding侠客1 小时前
使用Jmeter进行核心API压力测试
java·jmeter·apache·压力测试
龙俊亨1 小时前
maven坐标导入jar包时剔除不需要的内容
java·maven·jar
追风赶月、1 小时前
【Redis】Set集合、Zset有序集合以及其它数据类型
java·redis·mybatis
乎里陈1 小时前
【JAVA】十三、基础知识“接口”精细讲解!(三)(新手友好版~)
java·object·equals·tostring·hashcode·深拷贝浅拷贝·clonable
weixin_428498491 小时前
在Star-CCM+中实现UDF并引用场数据和网格数据
java·前端
工具罗某人1 小时前
IDEA 2024 版本配置热部署
java·ide·intellij-idea
王天华帅哥1 小时前
分布式id的两大门派!时钟回拨问题的解决方案!
java
wending-Y2 小时前
es 里的Filesystem Cache 理解
大数据·elasticsearch·mybatis
半青年2 小时前
基于Qt开发的http/https客户端
java·c++·qt·网络协议·http·https·信息与通信