SQL 索引突然 “罢工”？快来看看为什么

SQL 索引失效：那些让查询效率 "断崖式下跌" 的坑

在数据库操作中，SQL 索引就像图书馆里的分类目录，能帮我们快速定位到需要的数据，极大提升查询效率。可在实际开发中，很多开发者会遇到这样的情况：明明给字段建了索引，查询速度却依然很慢，甚至和没建索引时没差别 ------ 这很可能是索引 "失效" 了。今天，我们就来详细聊聊 SQL 索引失效的那些事儿，搞清楚哪些操作会让索引 "罢工"，以及该如何避免这些坑。

一、先搞懂：索引为什么会失效？

首先要明确的是，索引失效并非索引本身损坏，而是数据库的查询优化器在分析执行计划时，判断 "使用索引查询不如全表扫描高效"，或者因查询语句的写法问题，根本无法利用索引。简单来说，要么是 "用了不划算"，要么是 "根本用不了"。

接下来，我们就逐个拆解那些最容易导致索引失效的场景，每个场景都会结合实际 SQL 案例，让大家一眼看懂问题所在。

二、最容易让索引 "罢工"的场景

1. 对索引列做 "运算"：直接切断索引的 "查找路径"

索引的本质是通过 "预排序" 的索引列值快速定位数据，可如果我们在查询时对索引列做了函数运算、数学运算，相当于改变了索引列的原始值，数据库无法直接匹配索引，只能放弃索引转而全表扫描。

反面案例：

假设users表的create_time字段是索引列，我们想查询 "2024 年 1 月之后创建的用户"，若这样写 SQL：

sql 复制代码

-- 错误：对索引列使用函数DATE_FORMAT
SELECT * FROM users WHERE DATE_FORMAT(create_time, '%Y-%m') >= '2024-01';

这里对create_time做了DATE_FORMAT函数处理，索引无法识别运算后的结果，直接失效。

正确写法：

避免在索引列上做运算，把条件转化为对原始值的判断：

sql 复制代码

-- 正确：直接使用索引列原始值
SELECT * FROM users WHERE create_time >= '2024-01-01 00:00:00';

类似的坑还有 "数学运算"，比如对索引列price写price + 10 > 100，也会导致索引失效，应改为price > 90。

2. LIKE 查询 "% 开头"：索引无法匹配模糊前缀

LIKE 是模糊查询的常用语法，但如果通配符%放在开头，比如LIKE '%张三'，索引就会失效。因为索引是按 "前缀顺序" 排序的，无法确定 "%" 代表的前置字符，自然无法快速定位。

反面案例：

users表的name是索引列，想查询 "名字包含'三'的用户"，若这样写：

sql 复制代码

-- 错误：%开头，索引失效
SELECT * FROM users WHERE name LIKE '%三';

此时数据库只能逐行扫描所有数据，判断名字是否包含 "三"，效率极低。

正确写法：

如果业务允许，尽量让%只在末尾（前缀确定）；若必须模糊匹配中间或开头，可考虑全文索引（如 MySQL 的 FULLTEXT 索引）：

sql 复制代码

-- 正确1：%只在末尾，索引有效
SELECT * FROM users WHERE name LIKE '张%';
-- 正确2：需中间匹配时，用全文索引（需先创建）
CREATE FULLTEXT INDEX idx_name ON users(name);
SELECT * FROM users WHERE MATCH(name) AGAINST('三' IN BOOLEAN MODE);

3. 隐式类型转换：数据类型不匹配，索引 "认不出" 字段

当查询条件中的值类型，与索引列的定义类型不匹配时，数据库会自动进行 "隐式类型转换"。这个过程会改变索引列的原始值，导致索引无法使用。

反面案例：

users表的phone字段是VARCHAR类型（存储手机号），并建立了索引。若查询时用数字类型传值：

sql 复制代码

-- 错误：phone是字符串，传值是数字，触发隐式转换
SELECT * FROM users WHERE phone = 13800138000;

此时数据库会自动把phone列的所有值转换成数字（相当于CAST(phone AS UNSIGNED)），索引列的原始排序被破坏，索引失效。

正确写法：

确保查询条件的值类型与索引列一致，字符串类型加引号：

sql 复制代码

-- 正确：传值为字符串，与索引列类型匹配
SELECT * FROM users WHERE phone = '13800138000';

4. 联合索引不遵循 "最左前缀原则"：索引只认 "左边的列"

联合索引（多列索引）是按 "最左前缀顺序" 构建的，比如索引idx_a_b_c（a、b、c 三列），数据库只会优先匹配 "从左到右" 的列。如果跳过左侧列，直接使用右侧列作为查询条件，索引就会失效。

举个例子：

假设orders表有联合索引idx_userid_orderdate_amount（user_id、order_date、amount），我们来看看不同查询的情况：

SQL 语句	索引是否有效	原因分析
SELECT * FROM orders WHERE user_id = 100	有效	使用了最左前缀 user_id
SELECT * FROM orders WHERE user_id=100 AND order_date='2024-05-01'	有效	使用了 user_id+order_date，符合左前缀
SELECT * FROM orders WHERE order_date='2024-05-01'	失效	跳过了最左列 user_id，索引无法匹配
SELECT * FROM orders WHERE user_id=100 AND amount>100	有效	虽跳过 order_date，但左前缀 user_id 已使用（仅用 user_id 部分索引）

即使用联合索引时，必须从 "最左边的列" 开始匹配，哪怕只用最左列，也能利用部分索引；一旦跳过左列，整个索引就会失效。

5. OR 连接 "非索引列"：一条条件不达标，整句索引失效

OR 用于连接多个查询条件时，数据库需要同时满足 "所有条件都能利用索引"，才能使用索引。如果 OR 两侧有一个条件对应的列没有索引，那么整个查询都无法使用索引 ------ 因为数据库无法确定 "先通过索引找一部分数据，再扫描另一部分数据" 是否高效，干脆直接全表扫描。

反面案例：

users表的name是索引列，但age没有索引。若这样写查询：

sql 复制代码

-- 错误：OR右侧的age无索引，导致整个查询索引失效
SELECT * FROM users WHERE name = '张三' OR age = 30;

此时，即使name有索引，数据库也会放弃使用，转而全表扫描。

正确写法：

要么给age也建立索引，让 OR 两侧的条件都能利用索引；要么拆分查询，用 UNION 连接结果（视业务场景选择）：

sql 复制代码

-- 正确1：给age建索引，OR两侧均有索引
CREATE INDEX idx_age ON users(age);
SELECT * FROM users WHERE name = '张三' OR age = 30;
-- 正确2：拆分查询，用UNION连接
SELECT * FROM users WHERE name = '张三'
UNION ALL
SELECT * FROM users WHERE age = 30;

6. 查询结果 "占比过大"：索引不如全表扫描划算

索引的优势是 "快速定位少量数据"，如果查询需要返回表中大部分数据（比如超过 30%），数据库会认为 "用索引查找后，还需要回表取数据，反而不如直接全表扫描高效"，从而主动放弃索引。

例子：

products表有 100 万条数据，若查询 "所有价格低于 1000 元的商品"，而这类商品占了 80%：

sql 复制代码

-- 可能失效：结果集占比过大，优化器选择全表扫描
SELECT * FROM products WHERE price < 1000;

此时，即使price有索引，数据库也会判断 "全表扫描更省时间"，索引自然不会被使用。

应对方案：

这种情况本质是 "业务需求决定的"，若必须查询大量数据，可考虑：

只查询需要的列（避免SELECT *），减少回表开销；

若业务允许，拆分查询（比如按时间分批次查询）；

对大表进行分区（如按price范围分区），提升扫描效率。

7. 其他容易被忽略的 "小坑"

除了上述常见场景，还有一些细节也可能导致索引失效，需要特别注意：

NOT IN / NOT EXISTS：这两个语法容易让优化器判断失误，导致索引失效。比如WHERE id NOT IN (1,2,3)，可改用LEFT JOIN ... IS NULL替代，效率更高。

示例：

sql 复制代码

-- 优化前：NOT IN可能失效
SELECT * FROM users WHERE id NOT IN (SELECT user_id FROM orders);
-- 优化后：LEFT JOIN替代，更易利用索引
SELECT u.* FROM users u
LEFT JOIN orders o ON u.id = o.user_id
WHERE o.user_id IS NULL;

索引列含 NULL 值：部分数据库（如 MySQL）对含 NULL 的索引处理特殊。如果索引列有大量 NULL 值，且查询条件包含IS NULL/IS NOT NULL，可能导致索引失效。建议尽量让索引列 "非空"（如用默认值替代 NULL）。

优化器 "判断失误" ：数据库优化器会根据 "表统计信息"（如数据分布、表大小）选择执行计划。如果统计信息过时（比如表数据刚大量更新），优化器可能误判 "全表扫描更优"，导致索引失效。此时需手动更新统计信息（如 MySQL 的ANALYZE TABLE 表名）。

三、如何避免索引失效？记住这 6 个原则

了解了常见的失效场景后，我们可以总结出一些实用原则，帮大家在开发中规避风险：

不碰索引列的 "原始值" ：避免在索引列上做函数、数学运算，不触发隐式类型转换；

联合索引 "从左到右用" ：严格遵循最左前缀原则，不跳过左侧列；

LIKE 查询 "% 只在尾" ：非必要不使用%开头的模糊查询，需全局匹配时用全文索引；

OR 条件 "全有索引" ：确保 OR 两侧的条件列都有索引，或用 UNION 拆分；

定期更新 "统计信息" ：比如 MySQL 的ANALYZE TABLE、Oracle 的DBMS_STATS，让优化器获取准确数据；

用 "执行计划" 验证：写完 SQL 后，通过EXPLAIN（MySQL）或EXPLAIN PLAN（Oracle）查看执行计划，判断索引是否被使用（若type列显示ALL，说明全表扫描，索引可能失效）。

四、最后：索引不是 "越多越好"

需要提醒的是，避免索引失效不代表 "建越多索引越好"。索引会占用存储空间，且在插入、更新、删除数据时，需要同步维护索引，反而会降低写操作效率。因此，建索引要 "按需设计"：

只给频繁用于查询条件、排序、分组的列建索引；

避免给重复值多的列（如 "性别"）建索引（索引区分度低，效果差）；

小表无需建索引（全表扫描本身就很快）。

最后，SQL 索引失效是开发中很常见的问题，很多时候是 "写法不当" 导致的。只要搞懂上述场景和原则，养成用EXPLAIN验证执行计划的习惯，就能有效避免索引失效，让数据库查询保持高效。