Mysql--基础知识点--94.1--嵌套子查询转关联查询

嵌套子查询（Non-correlated subquery）是指子查询独立于外层查询，不引用外层的列。它先执行子查询得到结果集，然后外层查询利用这个结果集进行过滤或计算。

关联子查询（Correlated subquery）是指子查询引用了外层查询的列，对外层每一行都要执行一次子查询（通常可以利用索引快速判断）。

在某些场景下，将嵌套子查询改写成关联查询 （如 EXISTS 或 JOIN）可以大幅提升性能，避免子查询产生巨大的中间结果集，或者避免 NULL 带来的逻辑陷阱。

sql 复制代码

-- 找出所有下过至少一单的客户
SELECT * FROM customers 
WHERE customer_id IN (
    SELECT customer_id FROM orders   -- 子查询独立，不依赖外层
);

执行逻辑：

问题：如果 orders 表非常大（几百万行），子查询结果集巨大，会消耗大量内存和 I/O。

sql 复制代码

SELECT * FROM customers c
WHERE EXISTS (
    SELECT 1 FROM orders o 
    WHERE o.customer_id = c.customer_id   -- 关联条件
);

执行逻辑（实际优化器会做半连接）：

优势：

sql 复制代码

-- 同样查询有订单的客户，使用 JOIN（注意去重）
SELECT DISTINCT c.* 
FROM customers c
JOIN orders o ON c.customer_id = o.customer_id;

注意：JOIN 可能导致客户重复（一个客户有多笔订单），所以需要 DISTINCT。如果 customers.customer_id 是主键，DISTINCT 的开销通常可接受。

性能特点：

子查询结果集很小 （如几十行）且不经常执行：IN 写法更直观，性能差异可忽略。
需要判断 NOT IN 且子查询无 NULL ：但最好还是用 NOT EXISTS 或 LEFT JOIN 避免 NULL 陷阱。
子查询是标量查询 （返回单个值），例如 SELECT ... WHERE salary > (SELECT AVG(salary) FROM employees)，这种无法简单改成关联查询，因为子查询只需执行一次。

写法	子查询类型	执行次数	适用场景
`IN (SELECT ...)`	嵌套（非关联）	子查询执行1次	子查询结果集小，且外表大
`EXISTS (SELECT ... WHERE 关联)`	关联	外表每行执行1次（但可提前终止）	外表小，内表大，且内表有索引
`JOIN ... ON 关联`	关联	一次连接操作	需要同时获取两表数据，注意去重

核心建议：

默认优先考虑语义清晰 ，但遇到性能问题时，把嵌套子查询（特别是 IN 和 NOT IN）改写成关联查询（EXISTS 或 JOIN）是非常有效的优化手段。
使用 EXPLAIN 观察执行计划，确认数据库是否自动做了优化。