SQL 性能优化：为什么少用函数在 WHERE 条件中？

在 SQL 性能优化的面试或实战场景中，经常会听到这样一句话：

"不要在 WHERE 条件里对列使用函数。"

那么，为什么会有这样的建议？今天我们就从执行原理出发，结合案例来理解这个问题。

一、问题引入

假设有一张用户表：

CREATE TABLE users (

id INT PRIMARY KEY,

name VARCHAR(50),

created_at DATETIME

);

-- 插入数据

INSERT INTO users VALUES

(1, 'Tom', '2023-01-10 09:30:00'),

(2, 'Alice', '2023-02-01 15:20:00'),

(3, 'Bob', '2023-03-05 11:20:00');

如果我们想查询 2023-02 之后注册的用户，很多人会写：

SELECT * FROM users

WHERE MONTH(created_at) >= 2;

这看似没问题，但性能却很差。

二、函数对索引的影响

SQL 的执行优化器依赖索引来加速查询。

如果在 WHERE 子句中直接对列使用函数，比如 MONTH(created_at)，数据库必须逐行计算函数结果，然后再比较条件。这会导致索引失效，最终变成全表扫描。

换句话说：

WHERE 列 = 值 → 可以用索引。

WHERE 函数(列) = 值 → 索引失效，性能骤降。

三、优化写法

正确的写法是：避免对列使用函数，而是把计算提前。

例如上面的查询，可以改成：

SELECT * FROM users

WHERE created_at >= '2023-02-01 00:00:00';

这样数据库能直接使用 created_at 的索引范围扫描，效率大大提升。

再比如想查名字长度为 3 的用户：

错误写法：

SELECT * FROM users

WHERE LENGTH(name) = 3;

优化写法：

SELECT * FROM users

WHERE name >= 'aaa' AND name < 'aaaa';

思路就是：把函数计算转移到常量上，而不是列上。

四、实际建议

避免函数包裹列

如 WHERE YEAR(date_col) = 2023 改写成 WHERE date_col BETWEEN '2023-01-01' AND '2023-12-31'。

善用范围条件

BETWEEN、>=、< 通常比函数截取更高效。

确认索引生效

使用 EXPLAIN 分析执行计划，确保 SQL 走索引而不是全表扫描。

在必要时使用函数索引

部分数据库（如 MySQL 8.0 的函数索引、Oracle 的函数索引）允许对函数结果建索引，但一般场景下还是推荐避免函数计算。

五、总结

在 WHERE 条件里使用函数，往往会导致索引失效，查询性能下降。

优化思路是提前计算常量，把函数逻辑转移到等号右边或用范围条件代替。

如果确实需要函数，可以考虑函数索引，但这不是常规手段。

一句话总结：

SQL 优化的核心原则之一就是让索引能被用到，而在 WHERE 子句里少用函数，就是为了保证这一点。