为什么MySQL索引不生效?来看看这8个原因

在数据库优化中,最让人头疼的事情之一莫过于精心设计的索引没有发挥作用。为什么会出现这种情况?

这篇文章带大家一起探讨一些常见原因,方便大家更好地理解MySQL查询优化器是如何选择索引的,以及在出现类似问题时,可逐项进行对照排查,

以一个简单的 people 表作为例子,表结构如下:

r 复制代码
CREATE TABLE `people` (
  `id` bigint unsigned NOT NULL AUTO_INCREMENT,
  `first_name` varchar(50) NOT NULL,
  `last_name` varchar(50) NOT NULL,
  `state` char(2) NOT NULL,
  PRIMARY KEY (`id`),
  KEY `first_name` (`first_name`),
  KEY `state` (`state`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_unicode_ci

后续会以该表结构为基础,通过添加或删除索引来展示不同场景。

确认索引是否被使用

在分析索引未生效的原因之前,首先需要判断 MySQL 是否使用了索引。可以通过 EXPLAIN 命令来查看查询优化器的分析结果,了解哪些索引被考虑,以及最终选择使用了哪个索引。

例如,以下查询会试图通过 first_name 索引查找数据:

ini 复制代码
EXPLAIN SELECT * FROM people WHERE first_name = 'Aaron';

返回结果如下:

id table type possible_keys key key_len ref rows filtered Extra
1 people ref first_name first_name 202 const 180 100.00

从结果中可以看到:

  • possible_keys 表示查询优化器会考虑的索引,这里是 first_name 索引。
  • key 表示实际被选中的索引,也是 first_name

关于EXPLAIN 的使用,可参考《仅仅会用MySQL的EXPLAIN还不够,还需要会用EXPLAIN ANALYZE》这篇文章。

在本例中,first_name 索引不仅被优化器考虑(considered),而且最终被选中(chosen)。这是两个相关但不同的步骤:首先,优化器会根据查询筛选可用的索引;然后,选择性能较优的索引。

确认索引是否被使用后,接下来分析一些索引未生效的常见原因。

索引未生效的原因

原因 1:另一个索引更优

当查询可以利用多个索引时,MySQL 优化器会选择其中最优的索引。如果你的查询可以同时使用多个索引,但最终未选择预期的索引,很可能是因为另一个索引的效率更好。

例如,以下查询同时使用 first_namestate 字段:

ini 复制代码
SELECT * FROM people
WHERE first_name = 'Aaron'
AND state = 'TX';

运行 EXPLAIN 后结果如下:

id table type possible_keys key key_len ref rows filtered Extra
1 people ref first_name,state first_name 202 const 180 50.00 Using where

在这个例子中,first_name 索引比 state 索引的选择性更高,因此优化器选择了 first_name 索引。

原因 2:索引的选择性和基数

索引的性能往往与选择性和基数相关:

  • 基数(Cardinality) 是列中不同值的数量。
  • 选择性(Selectivity) 是指这些值的独特程度(计算公式为 COUNT(DISTINCT column) / COUNT(*))。

比如,可以通过以下查询计算基数和选择性:

scss 复制代码
SELECT
  COUNT(DISTINCT first_name) as first_name_cardinality,
  COUNT(DISTINCT state) as state_cardinality,
  COUNT(DISTINCT first_name) / COUNT(*) as first_name_selectivity,
  COUNT(DISTINCT state) / COUNT(*) as state_selectivity
FROM people;

结果如下:

first_name_cardinality state_cardinality first_name_selectivity state_selectivity
3009 2 0.0060 0.0000
  • first_name 字段的不同值非常多,因此选择性较高。
  • state 列选择性极低,导致通过 state 索引进行过滤时,效果较差。

高选择性索引通常性能较优,而低选择性索引在过滤数据时作用有限。

此外,唯一索引(如 id 的主键索引)通常具有完美选择性。

原因 3:选择性因查询而异

索引的选择性是基于整个表数据分布进行计算的,但选择性在具体查询场景中可能不一样。例如:

假如表中有 100 万行,其中 99% 的用户类型是 user,只有 1% 为 admin,总体来看 type 列选择性很低。但如果你的查询条件是 type = 'admin',此时索引的作用就很明显。

优化器会根据查询条件和数据分布动态评估索引的价值。

原因 4:过时或不准确的统计数据

MySQL 的索引基数统计信息是通过随机采样维护的,可能出现因统计信息过时而导致优化器做出错误决策的情况。可以通过以下命令更新统计信息:

css 复制代码
ANALYZE TABLE people;

如果统计数据采样精度不足,可以通过调整 MySQL 的相关参数改善采样质量。

原因 5:表扫描更快

某些情况下,优化器会选择直接扫描整个表而不是使用索引。这可能发生在以下场景:

  1. 表的大小较小,表扫描成本几乎可以忽略。
  2. 查询需要获取大部分表数据,索引的过滤能力不足,导致索引的额外开销反而拖慢查询速度。

虽然表扫描看起来反直觉,但在特定情况下确实更高效。

原因 6:索引的结构性限制

理解索引的底层结构(如 B+ 树),有助于分析某些查询为什么无法用到索引。主要有以下几个场景:

场景 1:通配符搜索

MySQL 的索引只能用于匹配字符串的前缀部分,不能用于字符串中的后缀或包含部分。例如:

  • 查询 LIKE 'Aa%' 可以使用索引。
  • 查询 LIKE '%ron' 则无法使用索引。

如果你需要复杂的字符串搜索,可以考虑使用全文索引(Fulltext Index)或专门设计的数据模型。

场景 2:复合索引的左前缀规则

复合索引要求使用时遵循"左前缀"规则,例如:

sql 复制代码
ALTER TABLE people ADD INDEX multi (first_name, state);
  • 查询条件包含 first_namestate 时会正确使用索引。
  • 查询条件仅包含 state 时因不满足左前缀无法使用复合索引。

场景 3:连接列类型或字符集不匹配

若连接的字段类型或字符集不一致,索引将无法生效。例如:

  • VARCHAR(10)CHAR(10) 类型和长度相同,索引可用。
  • VARCHAR(10)CHAR(15) 则因长度不同导致索引不可用。

确保字段定义一致是索引生效的前提。

原因 7:索引被模糊化处理

某些查询因对字段使用了函数或运算导致索引无法使用。例如:

sql 复制代码
SELECT * FROM people WHERE YEAR(created_at) = 2023;

上述查询无法使用 created_at 索引,因为 MySQL 没法直接基于函数计算进行优化。替代方案如下:

sql 复制代码
SELECT * FROM people WHERE created_at BETWEEN '2023-01-01' AND '2023-12-31';

通过范围查询可以正常使用索引。

原因 8:隐藏索引

MySQL 支持隐藏索引,隐藏索引不会被查询优化器使用。例如:

sql 复制代码
ALTER TABLE people ALTER INDEX first_name INVISIBLE;

Hidden 索引可以用于测试索引删除的影响,若查询性能下降可以随时恢复索引。

强制使用索引

如果你认为 MySQL 优化器的决策不正确,可以通过 USE INDEX 提示优化器使用指定索引:

ini 复制代码
EXPLAIN SELECT * FROM people USE INDEX (state) WHERE first_name = 'Aaron' AND state = 'TX';

但使用 USE INDEX 应该谨慎,因为可能在数据量增长后需要重新评估是否强制使用某索引。

总结

索引优化涉及多个方面,包括查询优化器运作、数据分布、索引结构等。了解索引未生效的原因并合理优化查询,可以显著提升数据库性能。索引虽强大,但只有正确规划和使用才能发挥最大效用。

相关推荐
知其然亦知其所以然3 小时前
MySQL 社招必考题:如何优化 UNION 查询?
后端·mysql·面试
翻斗花园刘大胆3 小时前
JavaWeb之HttpServletRequest与HttpServletResponse详解及快递管理系统实践
java·开发语言·数据库·mysql·servlet·架构·mvc
我不是混子4 小时前
MySQL中如何查看数据库容量大小、表容量大小、索引容量大小?
后端·mysql
Coding_Doggy4 小时前
java面试day3 | 框架篇、Spring、SpringMVC、SpringBoot、MyBatis、注解、AOP、Bean
java·mysql·面试
向宇it8 小时前
【Mysql知识】Mysql索引相关知识详解
数据库·mysql
yes_is_ok12 小时前
自动化单mysql多实例库的全量迁移脚本
运维·mysql·自动化
王不忘.12 小时前
MySQL 数据库核心知识点详解
数据库·mysql
xhbh66614 小时前
MySQL分库分表详解:从原理、策略到ShardingSphere中间件选型,避坑指南一篇就够了
数据库·mysql·mysql分库分表
wuyunhang12345615 小时前
MySQL----MVCC机制
数据库·mysql