《MYSQL实战45讲 》 优化器如何选择索引?

复制代码
SHOW VARIABLES LIKE 'long_query_time';
复制代码
set long_query_time=0

优化器如何选择索引?

1.扫描的行数

估计出各个索引大致的要扫描的行数,行数越少,效率越高。

索引的基数也叫区分度,就是这个索引所在的字段上不同的值又多少个。优化器通过各个索引的区分度来估计这条查询语句满足条件的记录又多少条。mysql是通过采样统计的方法估算出各个索引的基数的,也就是抽查20个数据页,然后统计这些页面上该索引所在字段的不同值的个数,计算出平均值,然后乘以这个索引的页面数,就得到索引的基数。但是这个基数是会更新的,当变更的数据行数超过十分之1时就会重新做一次统计。

2.对于具体的一个查询语句,优化器会预估这个语句要扫描多少行

就是explain之后的rows字段。

但是优化器不单单会比较多个索引的预估扫描行数,还会考虑到二次索引查询数据还要回表的问题,而主键索引不需要回表,尽管预估扫描可能更多,但是可能仍然选择主键索引

analyze table t命令,可以用来重新统计索引信息

对于这个查询语句

复制代码
SELECT * from t WHERE (a BETWEEN 1 and 1000) and (b BETWEEN 50000 and 100000) order by b LIMIT 1

优化器可以选择a索引,也可以使用b索引

1.假如选择a索引:

首先扫描索引a的前1000个值,然后查到每个记录对应的id,再回主键索引表去查出每一行,根据字段b来过滤。这样只需要扫描1000行

2.假如选择b索引,那就要扫描索引b的最后50001个值,需要扫描50001行

看起来选择a索引的话性能会更好,但是实际上优化器使用了b索引,错选的原因是优化器看到了后面的order by b 如果用b索引的话就避免排序了,因为索引的b+树节点本身就是有序的,如果先选择b索引来查,查出来的数据就是有序的,避免排序了。

相关推荐
IvorySQL2 小时前
PostgreSQL 分区表的 ALTER TABLE 语句执行机制解析
数据库·postgresql·开源
·云扬·2 小时前
MySQL 8.0 Redo Log 归档与禁用实战指南
android·数据库·mysql
IT邦德2 小时前
Oracle 26ai DataGuard 搭建(RAC到单机)
数据库·oracle
惊讶的猫3 小时前
redis分片集群
数据库·redis·缓存·分片集群·海量数据存储·高并发写
不爱缺氧i3 小时前
完全卸载MariaDB
数据库·mariadb
纤纡.3 小时前
Linux中SQL 从基础到进阶:五大分类详解与表结构操作(ALTER/DROP)全攻略
linux·数据库·sql
jiunian_cn3 小时前
【Redis】渐进式遍历
数据库·redis·缓存
橙露3 小时前
Spring Boot 核心原理:自动配置机制与自定义 Starter 开发
java·数据库·spring boot
冰暮流星3 小时前
sql语言之分组语句group by
java·数据库·sql
符哥20083 小时前
Ubuntu 常用指令集大全(附实操实例)
数据库·ubuntu·postgresql