SQL 性能优化:为什么少用函数在 WHERE 条件中?

在 SQL 性能优化的面试或实战场景中,经常会听到这样一句话:

"不要在 WHERE 条件里对列使用函数。"

那么,为什么会有这样的建议?今天我们就从执行原理出发,结合案例来理解这个问题。

一、问题引入

假设有一张用户表:

CREATE TABLE users (

id INT PRIMARY KEY,

name VARCHAR(50),

created_at DATETIME

);

-- 插入数据

INSERT INTO users VALUES

(1, 'Tom', '2023-01-10 09:30:00'),

(2, 'Alice', '2023-02-01 15:20:00'),

(3, 'Bob', '2023-03-05 11:20:00');

如果我们想查询 2023-02 之后注册的用户,很多人会写:

SELECT * FROM users

WHERE MONTH(created_at) >= 2;

这看似没问题,但性能却很差。

二、函数对索引的影响

SQL 的执行优化器依赖 索引 来加速查询。

如果在 WHERE 子句中直接对列使用函数,比如 MONTH(created_at),数据库必须逐行计算函数结果,然后再比较条件。这会导致 索引失效,最终变成全表扫描。

换句话说:

WHERE 列 = 值 → 可以用索引。

WHERE 函数(列) = 值 → 索引失效,性能骤降。

三、优化写法

正确的写法是:避免对列使用函数,而是把计算提前。

例如上面的查询,可以改成:

SELECT * FROM users

WHERE created_at >= '2023-02-01 00:00:00';

这样数据库能直接使用 created_at 的索引范围扫描,效率大大提升。

再比如想查名字长度为 3 的用户:

错误写法:

SELECT * FROM users

WHERE LENGTH(name) = 3;

优化写法:

SELECT * FROM users

WHERE name >= 'aaa' AND name < 'aaaa';

思路就是:把函数计算转移到常量上,而不是列上。

四、实际建议

  1. 避免函数包裹列

如 WHERE YEAR(date_col) = 2023 改写成 WHERE date_col BETWEEN '2023-01-01' AND '2023-12-31'。

  1. 善用范围条件

BETWEEN、>=、< 通常比函数截取更高效。

  1. 确认索引生效

使用 EXPLAIN 分析执行计划,确保 SQL 走索引而不是全表扫描。

  1. 在必要时使用函数索引

部分数据库(如 MySQL 8.0 的函数索引、Oracle 的函数索引)允许对函数结果建索引,但一般场景下还是推荐避免函数计算。

五、总结

在 WHERE 条件里使用函数,往往会导致 索引失效,查询性能下降。

优化思路是 提前计算常量,把函数逻辑转移到等号右边或用范围条件代替。

如果确实需要函数,可以考虑 函数索引,但这不是常规手段。

一句话总结:

SQL 优化的核心原则之一就是 让索引能被用到,而在 WHERE 子句里少用函数,就是为了保证这一点。

相关推荐
不知名的老吴几秒前
Redis的延迟瓶颈:TCP栈开销无法避免
数据库·redis·缓存
YOU OU几秒前
三大范式和E-R图
数据库
一江寒逸12 分钟前
零基础从入门到精通MySQL(上篇):筑基篇——吃透核心概念与基础操作,打通SQL入门第一关
数据库·sql·mysql
@土豆14 分钟前
Ubuntu 22.04 运行 Filebeat 7.11.2 崩溃问题分析及解决文档
linux·数据库·ubuntu
专注API从业者25 分钟前
淘宝商品详情 API 与爬虫技术的边界:合法接入与反爬策略的技术博弈
大数据·数据结构·数据库·爬虫
爱码小白33 分钟前
MySQL 单表查询练习题汇总
数据库·python·算法
WangJunXiang635 分钟前
第09章:PostgreSQL日常维护
数据库·postgresql
三道渊1 小时前
进程通信与网络协议
开发语言·数据库·php
徒 花1 小时前
数据库知识复习05
android·数据库
流觞 无依1 小时前
DedeCMS plus/download.php SQL注入漏洞修复教程
sql·php