复杂SQL性能突围：代价驱动的连接条件下推策略与工程实践

引言：当"逻辑清晰"遇上"性能陷阱"

在现代企业级应用中，SQL 早已不再是简单的单表查询。为了应对复杂的业务逻辑，开发人员倾向于使用 CTE（公用表表达式）、嵌套子查询、窗口函数和聚集操作来组织数据流程。这种写法虽然提升了代码的可读性和维护性，却往往给数据库优化器带来了"隐形炸弹"------尤其是在 连接条件无法有效下推到子查询内部 的场景下，中间结果集的膨胀会直接拖垮整个查询性能。

本文从一个真实客户案例出发，深入剖析复杂查询中因连接条件下推失败导致的性能瓶颈，并介绍金仓数据库在 V009R002C014 版本中引入的 基于代价模型的连接条件下推（Cost-based Join Predicate Pushdown） 方案。该方案通过"语义等价性保障"与"代价模型决策"的双重约束，在保证结果正确的前提下，实现了数量级的性能提升。

一、问题根源：高选择性条件为何"鞭长莫及"

1.1 客户场景还原

在许多业务系统中，SQL 往往呈现以下模式：

在子查询或 CTE 中完成复杂的预处理（如去重、聚合、窗口计算）；
外层再与其他表进行连接，并附带高选择性的过滤条件。

例如：

sql 复制代码

SELECT *
FROM (
    SELECT DISTINCT s1.a, s1.b
    FROM s1
) s
JOIN s2 ON s.s1a = s2.s2a
WHERE s2.b = 3;

从业务语义上看，这个查询逻辑清晰：先对 s1 去重，再与 s2 连接并过滤 s2.b = 3 的数据。但从执行层面分析，隐患巨大：

子查询 s 必须对 s1 执行全表扫描和去重操作；
外层 WHERE s2.b = 3 的高选择性条件无法"穿透"到子查询内部；
子查询产生一个庞大的中间结果集；
后续的连接和过滤全部基于这个大结果集进行，性能急剧下降。

问题的核心并非连接本身，而是 过滤发生得太晚。

1.2 业界面临的两大核心难点

将连接条件下推到子查询内部，直观上能有效解决上述问题。但数据库内核实现这一优化，需要跨越两道关卡：

1.2.1 语义等价性（Equivalence）

连接条件下推改变了谓词生效的位置，若处理不当，可能改变 SQL 的最终语义。尤其在以下场景中，下推必须格外谨慎：

包含聚集函数（GROUP BY）或窗口函数；
存在 DISTINCT、UNION 等集合操作；
涉及非确定性函数或带有副作用的表达式。

因此，并非所有连接条件都能安全下推，必须建立严格的等价性判定规则。

1.2.2 代价评估（Cost）

即便语义上等价，下推也未必总是"划算"：

下推后可能将连接转化为参数化执行（Nested Loop 风格），若外层驱动表数据量巨大，子查询会被重复执行成千上万次；
极端情况下，参数化执行的累积开销可能超过原始的全表扫描方案，导致性能回退。

结论很明确：连接条件下推不仅要 "能推" ，更要 "值得推"。

二、传统优化器的"无力感"

在面对上述 SQL 时，传统优化器通常采用一种保守的执行策略：

完整执行子查询：扫描基表，完成去重、聚合、窗口计算等所有操作；
生成庞大的中间结果；
与外层表进行连接，并应用过滤条件。

这种策略的致命伤在于：外层的高选择性条件无法反作用于子查询的数据扫描阶段。当子查询本身计算复杂且数据量大时，这一路径几乎必然成为性能瓶颈。

三、金仓数据库的破局之道：等价 + 代价的双重驱动

金仓数据库在最新的 V009R002C014 版本中，针对上述痛点设计了一套 基于代价的连接条件下推 机制。整个决策过程分为两个阶段，确保优化既安全又高效。

3.1 阶段一：等价性判定（Can we push?）

本阶段的目标是识别 绝对安全 的下推机会，而非盲目下推。优化器会：

分析子查询的结构，判断是否满足语义等价条件；
对包含聚集、窗口、集合操作的复杂子查询进行专项约束检查；
将连接谓词拆分为 可参数化部分 （依赖外层列）和 子查询内部列 两部分。

只有通过等价性校验的谓词，才会被改写为参数化过滤条件，注入到子查询的扫描或过滤阶段。这一步的核心是确保：下推后的结果与原 SQL 完全一致。

3.2 阶段二：代价模型评估（Should we push?）

通过等价性校验后，优化器不会立即选择下推，而是进入代价评估环节：

估算下推前后的执行路径代价；
比较子查询的扫描行数、中间结果规模；
评估参数化执行可能带来的重复计算成本（驱动表基数 × 每次探测代价）；
最终选择整体代价最低的执行计划。

若代价模型判定下推收益不足甚至可能引发性能回退，优化器会自动放弃下推，转择其他执行路径。这一步保证了：下推后的计划真正更快。

下图概括了整个决策流程：

markdown 复制代码

        连接谓词
            │
            ▼
    ┌───────────────┐
    │ 等价性判定    │
    │ • 子查询结构  │
    │ • 语义安全    │
    └───────────────┘
            │ 通过？
            ▼
    ┌───────────────┐
    │ 代价模型评估  │
    │ • 下推前后代价│
    │ • 参数化开销  │
    └───────────────┘
            │ 值得？
            ▼
    执行下推或保留原计划

四、效果验证：从全表扫描到精准过滤

4.1 最小化用例对比

测试 SQL：

sql 复制代码

SELECT *
FROM (SELECT DISTINCT * FROM s3) s3
JOIN s1 ON s1.s1a = s3.s3a;

未下推 ：子查询全表扫描 + 去重，执行时间约 84 ms。
下推后 ：连接条件在子查询扫描阶段即参与过滤，执行时间降至 0.14 ms ，中间结果规模锐减，性能提升近 600 倍。

作为对比，某主流商业数据库（D厂商）在相同 SQL 下的执行时间为 1.62 ms（采用 Hint 强制 Nested Loop），远高于金仓下推后的耗时。

4.2 复杂场景验证

测试 SQL（包含 UNION、DISTINCT、窗口函数、多层子查询）：

sql 复制代码

EXPLAIN ANALYZE
SELECT *
FROM (
    SELECT *
    FROM (
        SELECT DISTINCT * FROM s3
        UNION
        SELECT DISTINCT * FROM s3 a
    ) s3
    JOIN s1 ON s1.s1d = s3.s3a
) s
JOIN (
    SELECT *
    FROM (
        SELECT s3a, SUM(s3b) OVER (PARTITION BY s3a) s3d
        FROM s3
    ) s3
    JOIN s1 ON s1.s1a = s3.s3a
) j ON s.s3d = j.s3a;

未下推时 ：多个子查询对基表进行全量扫描，生成巨大中间结果，最终连接成为瓶颈，总执行时间 1081 ms。
下推后 ：连接条件提前介入子查询扫描，所有子查询均由全表扫描转为选择性扫描，执行时间骤降至 0.23 ms ，提升超过 4700 倍。

通过对比可见，下推后的执行计划有效避免了中间结果的爆炸性增长，将"先计算后过滤"转变为"边过滤边计算"，极大释放了系统性能。

五、总结与展望

复杂查询中的连接条件下推，远非简单的规则改写，而是一项典型的 成本驱动型优化：

仅依赖规则，忽略代价，可能引入灾难性性能回退；
只关注代价，不保障等价，则会直接破坏 SQL 语义。

金仓数据库通过 等价性保障 + 基于代价的决策 的组合设计，在安全的前提下最大化连接条件的过滤能力，显著减少子查询阶段的数据扫描与中间结果规模，在复杂 SQL 场景中实现了数量级的性能提升。

这类优化对于 OLAP、混合负载以及复杂报表型查询尤为关键。未来，随着数据规模和查询复杂度的持续增长，代价驱动的智能下推技术将成为查询优化器演进的核心方向之一。

感谢各位大佬支持！！！
互三啦！！！