MySQL的深度分页及相关概念

文章目录

一、业务场景

mysql查询数据,数据量过大(百万级以上),分页查询数据的时候,比如每页1000条,到limit 5000000 1000的时候,就会很慢。为啥?怎么解决呢?

原因是:mysql底层会把前500w条数据都会回表查询,回表查询如果没有覆盖索引的话,那么本质是IO操作,即从磁盘里根据主键获取所有列的值,这个过程导致慢。

如何解决?

1、游标分页

前端传下lastId,我们根据前端传下来的这个参数直接在sql层利用lastId>的数据来查;(舍弃框架层比如mybatis-plus自带的底层是limit offset,pageSize 这种方式);

2、先查主键,在根据主键查对应的值。

避免回表。

3、其他方案? 待完善

主要看以下几个参考文档,写得不错,这里就不在赘述。

二、参考文档

MySQL百万数据深度分页优化思路分析

MySQL中什么是回表查询,如何避免和优化?

MySQL 中的回表是什么?

三、核心概念总结

索引:

聚簇索引、非聚簇索引、覆盖索引

聚簇索引:主键所以,primary key

非聚簇索引(二级索引):非主键索引,比如:唯一索引(unique index)、组合索引

覆盖索引:建立索引的字段和select 查询的字段一致,查询的时候不需要回表。这样的索引称之为覆盖索引。

回表: mysql查询时,先在索引树种根据已建立的索引查找到匹配到指定值的范围数据(ids),在根据ids(主键)去聚簇索引里查这行数据的所有列(这些数据是在磁盘上的,.ibd格式的文件,属于IO操作,耗时)。

索引下推 (ICP- Index Condition PushDown ):

在索引查询过程,先根据索引过滤掉大部分数据(索引建立要和查询条件一致,才能准确过滤和下推),避免大量无效数据回表,需要注意触发条件,可通过explain的Extra检测。

相关推荐
lekami_兰18 分钟前
MySQL 长事务:藏在业务里的性能 “隐形杀手”
数据库·mysql·go·长事务
爱学英语的程序员2 小时前
面试官:你了解过哪些数据库?
java·数据库·spring boot·sql·mysql·mybatis
·云扬·3 小时前
MySQL Redo Log落盘机制深度解析
数据库·mysql
码界筑梦坊3 小时前
330-基于Python的社交媒体舆情监控系统
python·mysql·信息可视化·数据分析·django·毕业设计·echarts
千寻技术帮5 小时前
10327_基于SpringBoot的视频剪辑咨询网站
mysql·源码·springboot·代码·视频咨询
洛豳枭薰6 小时前
MySQL 梳理
数据库·mysql
剩下了什么13 小时前
MySQL JSON_SET() 函数
数据库·mysql·json
java搬砖工-苤-初心不变14 小时前
MySQL 主从复制配置完全指南:从原理到实践
数据库·mysql
WangYaolove131416 小时前
基于python的在线水果销售系统(源码+文档)
python·mysql·django·毕业设计·源码
霖霖总总17 小时前
[小技巧66]当自增主键耗尽:MySQL 主键溢出问题深度解析与雪花算法替代方案
mysql·算法