覆盖索引
假设要执行一条语句:
sql
select * from T where k between 3 and 5;
初始对列k建立了索引,表中数据为:
那么其执行流程为:
-
在k索引树上找到k=3的记录,取得ID=300;
-
到ID索引树查到ID=300对应的记录。
-
在k索引树上找到下一个值k=5的记录,取得ID=500;
-
到ID索引树查到ID=500对应的记录。
-
在k索引树上找到下一个值k=6,发现不满足条件。
这个过程中,发生了回表。假如建立的索引能"覆盖"我们的查询需求,就不需要回表,这种索引称为覆盖索引。比如在上面的查询语句中,若查询的是列k而不是*,就是一个覆盖索引。
需要注意的是,在引擎内部使用覆盖索引在索引k上其实能读到R3-R5三个记录,但是由于Server层只会从引擎得到两条记录,因此MySQL认为扫描行数为2。
最左前缀原则
B+树这种索引结构,可以利用索引的最左前缀,来定位记录。
比如建立了(name,age)
的联合索引:
当要查询name="张三"
,可以快速定位到ID4,然后向后遍历。
当要查询where name like "张%"
,也能用上这个索引,定位到ID3,然后向后遍历。
因此,索引的最左前缀可以是联合索引的最左N个字段,也可以是字符串索引的最左M个字符。
索引下推
还是假设建立了(name,age)
的联合索引,现在有一条SQL语句如下:
sql
select * from tuser where name like '张%' and age=10 and ismale=1;
由最左前缀原则,这条语句能用上name的索引。
而其他条件的判断:
-
在MySQL 5.6前,只能从找到的第一个记录ID3开始一个个回表,到主键索引上找出数据行,再对比后面两个字段。
-
MySQL 5.6引入了索引下推优化,可以在索引遍历过程中,对索引中包含的字段先做判断,直接过滤不满足条件的记录,减少回表次数。
两者的比较如下,第一张图是无索引下推,第二张图是有索引下推,箭头表示回表:
参考资料:极客时间专栏《MySQL实战45讲》https://time.geekbang.org/column/intro/100020801?tab=catalog