《MYSQL实战45讲 》 优化器如何选择索引?

复制代码
SHOW VARIABLES LIKE 'long_query_time';
复制代码
set long_query_time=0

优化器如何选择索引?

1.扫描的行数

估计出各个索引大致的要扫描的行数,行数越少,效率越高。

索引的基数也叫区分度,就是这个索引所在的字段上不同的值又多少个。优化器通过各个索引的区分度来估计这条查询语句满足条件的记录又多少条。mysql是通过采样统计的方法估算出各个索引的基数的,也就是抽查20个数据页,然后统计这些页面上该索引所在字段的不同值的个数,计算出平均值,然后乘以这个索引的页面数,就得到索引的基数。但是这个基数是会更新的,当变更的数据行数超过十分之1时就会重新做一次统计。

2.对于具体的一个查询语句,优化器会预估这个语句要扫描多少行

就是explain之后的rows字段。

但是优化器不单单会比较多个索引的预估扫描行数,还会考虑到二次索引查询数据还要回表的问题,而主键索引不需要回表,尽管预估扫描可能更多,但是可能仍然选择主键索引

analyze table t命令,可以用来重新统计索引信息

对于这个查询语句

复制代码
SELECT * from t WHERE (a BETWEEN 1 and 1000) and (b BETWEEN 50000 and 100000) order by b LIMIT 1

优化器可以选择a索引,也可以使用b索引

1.假如选择a索引:

首先扫描索引a的前1000个值,然后查到每个记录对应的id,再回主键索引表去查出每一行,根据字段b来过滤。这样只需要扫描1000行

2.假如选择b索引,那就要扫描索引b的最后50001个值,需要扫描50001行

看起来选择a索引的话性能会更好,但是实际上优化器使用了b索引,错选的原因是优化器看到了后面的order by b 如果用b索引的话就避免排序了,因为索引的b+树节点本身就是有序的,如果先选择b索引来查,查出来的数据就是有序的,避免排序了。

相关推荐
2401_824222692 分钟前
HTML怎么标注字数限制提示_HTML实时字数统计占位【详解】
jvm·数据库·python
稀饭过霍17 分钟前
数据类型【TINYINT、SMALLINT、INT、BIGINT、decimal(18,2)】表示意思
数据库
俺不要写代码21 分钟前
数据库:DML
数据库·oracle
这个DBA有点耶24 分钟前
两张百万级大表JOIN跑崩了?试试这3招
数据库·代码规范
IntMainJhy30 分钟前
「Flutter三方库sqflite的鸿蒙化适配与实战指南:从入门到踩坑的本地数据库开发全记录」
数据库·flutter·华为·信息可视化·数据库开发·harmonyos
counting money1 小时前
Spring框架基础(依赖注入-全注解形式)
java·数据库·spring
计算机安禾1 小时前
【Linux从入门到精通】第33篇:数据库MySQL/MariaDB安装与基础调优
linux·数据库·mysql
瀚高PG实验室1 小时前
ERROR: invalid input syntax for type integer: “a“
数据库·瀚高数据库
S1998_1997111609•X1 小时前
论next/js在打击省份及犯罪行为集团的系统分析[特殊字符]设计
网络·数据库·百度·ssh·开闭原则
dfdfadffa1 小时前
如何创建仅在首次订阅时执行一次计算的 RxJS 懒加载 Observable
jvm·数据库·python