一、什么是回表查询?
- 二级索引只会存储索引和主键,当通过二级索引查找数据时,如果想要找到其他列的数据就会拿着主键去聚簇索引里查询整行数据,这个过程就是回表
二、回表的性能代价?
- 回表不只是多了一次查询,而是多了很多次的随机IO操作
- 因为二级索引是根据索引的值排序的,二聚簇索引是根据主键的值进行排序的。
- 比如查询age=20的人的信息,可能会查到不同无序的id,拿着这些id去聚簇索引查询会定位到不同的数据页,产生大量的随机IO。
- 顺序IO可以利用磁盘预读,一次读取一大片的数据,而随机IO每次都会定位到不同的数据页,效率大大降低。
三、如何避免回表?
- 避免使用
select *,如果返回的列正好是索引的列,尽量写出列名,从而避免回表查询。 - 用覆盖索引,联合索引的列包含所有返回的列
- 索引下推
四、什么时候MySQL会放弃索引直接回表查询?
- 如果回表次数太多,可能会放弃索引而使用全表扫描
- 如果返回的数据量超过了表的15%-30%,优化器可能会放弃二级索引,因为会回表产生太多随机IO不如直接全表扫描
五、一个查询走了索引但还是慢的原因是什么?
- 大概率是回表次数太多,产生大量随机IO。
- 利用explain 查看row 如果很高,代表回表代价高
- 优化办法就是使用覆盖索引,或者缩小结果集。
六、怎么判断一个查询到底有没有走索引?
- 使用explain,看extra列,
using index表示使用了覆盖索引,没有回表查询,如果using index condition说明用到了索引下推,有回表。 - type 是
index全索引扫描,也有可能回表。
七、主键查询要回表吗?
- 回表查询只发生在二级索引中
- 主键查询是聚簇索引,叶子节点存的就是正行数据,所以不需要回表。