MySQL为什么会选错索引

有的时候,我们加了索引,也不一定最终查询语句就能用上索引,因为Innodb要不要使用索引,该使用哪个索引是优化器决定的,它是根据成本(代价)预估来选择的,他会倾向于选择一个成本最低的方式进行查询。

原因

基数性(Cardinality)

索引的基数性其实就是我们通常说的区分度,表示索引中不同值的数量。基数性越高,索引区分度越好,优化器越倾向于使用该索引。

选择性(Selectivity)

选择性是指索引过滤数据的能力。高选择性意味着索引能过滤掉更多的行,优化器会偏向于使用这样的索引。

这个因素是决定着扫描行数的关键。同一个查询语句,选择性更高的索引会使得扫描行数更少。

索引覆盖

如果一个查询可以完全通过索引来解决,即所需的所有列都包含在索引中,优化器会倾向于使用这样的"覆盖索引"。

ORDER BY

为了避免额外的排序操作,当SQL语句中有ORDER BY时,如果这个字段有索引,那么优化器为了减少file sort,会愿意选择使用这个索引,因为索引天然有序。

索引类型

不同类型的索引(如B-TREE、HASH、FULLTEXT等)适用于不同类型的查询。优化器会根据查询类型选择最合适的索引。

JOIN类型和顺序

对于包含JOIN的查询,优化器会考虑使用哪些索引以及JOIN的顺序。

索引的大小和深度

较小、较浅的索引通常更快,因为它们占用更少的磁盘空间,可以更快地加载到内存中。

访问类型

访问类型,如范围查询、点查找、扫描等,也会影响索引的选择。例如,某些索引可能更适合范围查询。

内存使用

对于大型表,优化器还会考虑执行计划的内存使用情况,尽量避免造成过多的内存占用。

系统资源限制

优化器还会考虑系统的资源限制,如内存和磁盘I/O。

查询缓存

如果启用了查询缓存且相同的查询已被缓存,优化器会使用这个缓存的结果而不是选择新的索引。

这里面比较重要的因素就是索引的基数性(区分度)、索引的选择性(扫描行数)、是否有索引覆盖等这几个。

因为如何选择索引是由以上这些因素共同决定的,所以最终选错了索引,可能有以下几个原因:

不准确的统计信息

InnoDB存储引擎依赖统计信息来决定使用哪个索引,如基数性、选择性这些都是统计信息。如果这些统计信息过时或不准确,优化器可能做出错误的决策。

复杂的查询逻辑

对于复杂的查询,尤其是那些包含多表join、子查询、函数等的查询,优化器可能难以准确判断哪个索引最有效。

系统和配置因素

MySQL的配置设置和系统资源限制(如内存大小)也会影响优化器的决策。

==================================================================

如何解决

如果发现mysql选择了一个错误的索引,一般来说有以下几种解决方式:

更新统计信息

定期运行ANALYZE TABLE命令来更新表的统计信息。这可以帮助优化器更准确地评估各个索引的有效性。

使用强制索引(FORCE INDEX)

如果我们确定某个索引比优化器选择的更有效,可以在查询中使用FORCE INDEX来强制使用特定索引。

如SELECT * FROM hollis_test_table FORCE INDEX (idx_name) WHERE name ='wutongshu';

但是,FORCE INDEX 应该谨慎使用,因为强制使用特定的索引可能会导致性能下降,特别是当表的数据分布发生变化时。在使用之前,应该确保理解该索引为什么是最好的选择,并且定期评估其效果。

优化查询

简化查询逻辑,尽量避免复杂的连接和子查询,这有助于优化器做出更好的决策。

调整索引

我们可以为where条件中的过滤条件创建更合适的索引,并尽可能考虑创建复合索引来提高查询效率,尤其是对于多列的过滤和排序。

调整MySQL配置

根据系统的资源和需求调整MySQL的配置参数,比如缓冲池大小(innodb_buffer_pool_size)。

相关推荐
运维行者_4 小时前
企业无线网络监控的挑战与智能化演进趋势
大数据·运维·服务器·网络·数据库
国强_dev5 小时前
技术探讨:使用 stunnel 加密转发数据库连接时,如何获取客户端真实 IP?
数据库·网络协议·tcp/ip
@insist1235 小时前
系统规划与管理师-信息系统规划核心工作要点解析
数据库·软考·系统规划与管理师·软件水平考试·系统规划与管理工程师
超级数据查看器5 小时前
超级数据查看器 v10.0 发布
java·大数据·数据库·sqlite·安卓
数安3000天5 小时前
增量数据如何自动分类分级,避免目录“过期“?
大数据·数据库
南墙上的石头6 小时前
麒麟 V10 重装人大金仓 V8R6 踩坑实录(含 MySQL 兼容模式)
数据库·mysql
画中有画7 小时前
论向量数据库在项目中的应用
数据库
spider_xcxc8 小时前
Redis 数据库高质量实践指南(一)
运维·数据库·redis·oracle·云计算
l1t8 小时前
在linux和windows中解决duckdb 1.6dev版本输出执行计划报错问题
linux·运维·数据库·windows·duckdb
执子手 吹散苍茫茫烟波9 小时前
RC 隔离级别下 MySQL InnoDB 死锁典型案例
数据库·mysql