SQL Join 中函数使用对性能的影响与优化方法

在日常开发中,经常会遇到这样的场景:

需要在 大小写不敏感格式化字段 的情况下进行表关联。

如果在 JOINWHERE 中直接使用函数,往往会带来严重的性能问题。

本文用一个新的示例来说明问题和优化方法。


一、问题场景

假设我们有两张表:

  • 用户表 user_info

    diff 复制代码
    user_id   | username
    ----------+------------
    1         | Alice
    2         | Bob
    3         | Charlie
  • 订单表 order_info

    yaml 复制代码
    order_id  | buyer_name
    ----------+------------
    1001      | alice
    1002      | BOB
    1003      | dave

我们希望根据用户名和买家名称进行关联(忽略大小写)。


原始写法(低效)

sql 复制代码
SELECT o.order_id, u.user_id, u.username
FROM order_info o
LEFT JOIN user_info u
    ON LOWER(o.buyer_name) = LOWER(u.username);

问题

  • LOWER() 包裹了字段,导致数据库无法使用索引。
  • 每一行都要执行函数运算,性能下降。

二、优化方法

1. 子查询提前计算

通过子查询生成派生列,再进行关联。

sql 复制代码
SELECT o.order_id, u.user_id, u.username
FROM (
    SELECT order_id, buyer_name, LOWER(buyer_name) AS buyer_name_lower
    FROM order_info
) o
LEFT JOIN (
    SELECT user_id, username, LOWER(username) AS username_lower
    FROM user_info
) u
    ON o.buyer_name_lower = u.username_lower;

优点

  • 避免在 JOIN 时重复调用函数。
  • 优化器有机会物化子查询并建立临时索引。

2. 建立函数索引(推荐)

如果这种需求非常频繁,可以在表上建立函数索引。

PostgreSQL 示例

scss 复制代码
CREATE INDEX idx_username_lower ON user_info(LOWER(username));
CREATE INDEX idx_buyer_name_lower ON order_info(LOWER(buyer_name));

之后即使写:

sql 复制代码
SELECT ...
FROM order_info o
LEFT JOIN user_info u
    ON LOWER(o.buyer_name) = LOWER(u.username);

数据库也能走索引,性能大幅提升。


3. 数据入库时统一格式

如果业务允许,可以在入库时统一转为小写,避免查询时做转换。

sql 复制代码
INSERT INTO user_info (user_id, username)
VALUES (1, LOWER('Alice'));

这样关联时直接比较即可:

ini 复制代码
ON o.buyer_name = u.username

三、总结

  • JOINWHERE 中直接使用函数,会 导致索引失效,影响性能。

  • 优化方法

    1. 子查询提前计算,避免在关联时重复调用函数;
    2. 建立函数索引(或虚拟列索引);
    3. 入库时统一数据格式,彻底消除函数依赖。

📌 记忆要点

  • 函数写在 JOIN → 慢
  • 子查询提前算 → 好
  • 函数索引 / 数据规范化 → 最优解
相关推荐
武昌库里写JAVA9 小时前
Java 设计模式在 Spring 框架中的实践:工厂模式与单例模式
java·vue.js·spring boot·sql·学习
计算机毕设残哥11 小时前
紧跟大数据技术趋势:食物口味分析系统Spark SQL+HDFS最新架构实现
大数据·hadoop·python·sql·hdfs·架构·spark
楠目12 小时前
SQL注入与防御:从攻击原理到预编译防御
数据库·sql
喃寻~18 小时前
java面试
数据库·sql·mysql
float_六七1 天前
SQL流程控制函数完全指南
数据库·sql·adb
AI绘画哇哒哒1 天前
实战:SQL统一访问200+数据源,构建企业级智能检索与RAG系统(下)
人工智能·sql·深度学习·学习·ai·程序员·大模型
满昕欢喜1 天前
SQL Server从入门到项目实践(超值版)读书笔记 27
数据库·sql·sqlserver
亚林瓜子1 天前
AWS中的离线计算(大数据大屏项目)
大数据·hadoop·sql·spark·云计算·aws
不剪发的Tony老师2 天前
SQLE:一个全方位的SQL质量管理平台
数据库·sql