MySQL的深度分页及相关概念

文章目录

一、业务场景

mysql查询数据,数据量过大(百万级以上),分页查询数据的时候,比如每页1000条,到limit 5000000 1000的时候,就会很慢。为啥?怎么解决呢?

原因是:mysql底层会把前500w条数据都会回表查询,回表查询如果没有覆盖索引的话,那么本质是IO操作,即从磁盘里根据主键获取所有列的值,这个过程导致慢。

如何解决?

1、游标分页

前端传下lastId,我们根据前端传下来的这个参数直接在sql层利用lastId>的数据来查;(舍弃框架层比如mybatis-plus自带的底层是limit offset,pageSize 这种方式);

2、先查主键,在根据主键查对应的值。

避免回表。

3、其他方案? 待完善

主要看以下几个参考文档,写得不错,这里就不在赘述。

二、参考文档

MySQL百万数据深度分页优化思路分析

MySQL中什么是回表查询,如何避免和优化?

MySQL 中的回表是什么?

三、核心概念总结

索引:

聚簇索引、非聚簇索引、覆盖索引

聚簇索引:主键所以,primary key

非聚簇索引(二级索引):非主键索引,比如:唯一索引(unique index)、组合索引

覆盖索引:建立索引的字段和select 查询的字段一致,查询的时候不需要回表。这样的索引称之为覆盖索引。

回表: mysql查询时,先在索引树种根据已建立的索引查找到匹配到指定值的范围数据(ids),在根据ids(主键)去聚簇索引里查这行数据的所有列(这些数据是在磁盘上的,.ibd格式的文件,属于IO操作,耗时)。

索引下推 (ICP- Index Condition PushDown ):

在索引查询过程,先根据索引过滤掉大部分数据(索引建立要和查询条件一致,才能准确过滤和下推),避免大量无效数据回表,需要注意触发条件,可通过explain的Extra检测。

相关推荐
卿着飞翔1 小时前
ubuntu上的mysql远程连不上root
mysql·ubuntu·adb
亚林瓜子2 小时前
AWS中国云中的ETL之从Amazon Glue Data Catalog搬数据到MySQL(Glue版)
python·mysql·spark·etl·aws·glue·py
wangmengxxw2 小时前
SpringAI-MySQLMcp服务
java·人工智能·mysql·大模型·sse·springai·mcp
what丶k2 小时前
MySQL读写分离部署配置全解析(从原理到落地)
数据库·分布式·mysql
TracyCoder1232 小时前
MySQL 实战宝典(二):MySQL vs Elasticsearch 文本检索性能全方位对比
数据库·mysql·elasticsearch
TracyCoder1233 小时前
后端架构基石:MySQL、ES、Redis 与 RabbitMQ 核心设计指南
mysql·elasticsearch·架构
xiaolyuh1233 小时前
MySQL MVCC(多版本并发控制)实现机制深度解析
数据库·mysql
xuefeiniao3 小时前
docker mysql模式sql-mode不生效
sql·mysql·docker
小魏每天都学习3 小时前
【sql-网络拓扑-子网划分-控制流图】
数据库·sql·mysql