SQL Join 中函数使用对性能的影响与优化方法

在日常开发中,经常会遇到这样的场景:

需要在 大小写不敏感格式化字段 的情况下进行表关联。

如果在 JOINWHERE 中直接使用函数,往往会带来严重的性能问题。

本文用一个新的示例来说明问题和优化方法。


一、问题场景

假设我们有两张表:

  • 用户表 user_info

    diff 复制代码
    user_id   | username
    ----------+------------
    1         | Alice
    2         | Bob
    3         | Charlie
  • 订单表 order_info

    yaml 复制代码
    order_id  | buyer_name
    ----------+------------
    1001      | alice
    1002      | BOB
    1003      | dave

我们希望根据用户名和买家名称进行关联(忽略大小写)。


原始写法(低效)

sql 复制代码
SELECT o.order_id, u.user_id, u.username
FROM order_info o
LEFT JOIN user_info u
    ON LOWER(o.buyer_name) = LOWER(u.username);

问题

  • LOWER() 包裹了字段,导致数据库无法使用索引。
  • 每一行都要执行函数运算,性能下降。

二、优化方法

1. 子查询提前计算

通过子查询生成派生列,再进行关联。

sql 复制代码
SELECT o.order_id, u.user_id, u.username
FROM (
    SELECT order_id, buyer_name, LOWER(buyer_name) AS buyer_name_lower
    FROM order_info
) o
LEFT JOIN (
    SELECT user_id, username, LOWER(username) AS username_lower
    FROM user_info
) u
    ON o.buyer_name_lower = u.username_lower;

优点

  • 避免在 JOIN 时重复调用函数。
  • 优化器有机会物化子查询并建立临时索引。

2. 建立函数索引(推荐)

如果这种需求非常频繁,可以在表上建立函数索引。

PostgreSQL 示例

scss 复制代码
CREATE INDEX idx_username_lower ON user_info(LOWER(username));
CREATE INDEX idx_buyer_name_lower ON order_info(LOWER(buyer_name));

之后即使写:

sql 复制代码
SELECT ...
FROM order_info o
LEFT JOIN user_info u
    ON LOWER(o.buyer_name) = LOWER(u.username);

数据库也能走索引,性能大幅提升。


3. 数据入库时统一格式

如果业务允许,可以在入库时统一转为小写,避免查询时做转换。

sql 复制代码
INSERT INTO user_info (user_id, username)
VALUES (1, LOWER('Alice'));

这样关联时直接比较即可:

ini 复制代码
ON o.buyer_name = u.username

三、总结

  • JOINWHERE 中直接使用函数,会 导致索引失效,影响性能。

  • 优化方法

    1. 子查询提前计算,避免在关联时重复调用函数;
    2. 建立函数索引(或虚拟列索引);
    3. 入库时统一数据格式,彻底消除函数依赖。

📌 记忆要点

  • 函数写在 JOIN → 慢
  • 子查询提前算 → 好
  • 函数索引 / 数据规范化 → 最优解
相关推荐
lzhdim1 小时前
SQL 入门 12:SQL 视图:创建、修改与可更新视图
java·大数据·服务器·数据库·sql
@小柯555m2 小时前
MySql(高级操作符--操作符混合运用)
数据库·sql·mysql
@小柯555m9 小时前
MySql(高级操作符--Where in 和Not in)
数据库·sql·mysql
小的~~10 小时前
Milvus会存在SQL注入攻击吗?
数据库·sql·milvus
许彰午11 小时前
CacheSQL(三):双 HTTP 引擎与 SQL 查询——接口抽象的价值
java·数据库·sql·缓存
俺不要写代码1 天前
数据库:DQL
数据库·sql·mysql
uElY ITER1 天前
MySQL 中如何进行 SQL 调优
android·sql·mysql
禹凕1 天前
MYSQL——基础知识(元数据)
数据库·sql·mysql
juniperhan1 天前
Flink 系列第22篇:Flink SQL 参数配置与性能调优指南:从 Checkpoint 到聚合优化
大数据·数据仓库·分布式·sql·flink