递归CTE查询优化方案

递归CTE查询优化方案(1万ID子资源查询)

问题描述

当 ID_LIST 有 1 万个时,递归 CTE 查询超时。已知数据 2-4 层,父子结构,root 是根节点,parent 是父节点。需求是查找这些资源的子资源 ID,1 万资源大多数是同级节点。

根本原因

  1. 1万个 IN 参数:大 IN 列表导致查询计划退化,参数绑定本身就很慢
  2. OR 条件阻断索引r2.root_uuid = r0.uuid OR r2.parent_uuid = r0.uuid 无法走复合索引
  3. 锚点冗余递归:1万个同级节点共享同一批父节点,递归会对相同父节点重复展开

方案一:临时表替换 IN(最直接)

sql 复制代码
-- 先把 1 万 ID 写入临时表
CREATE TEMPORARY TABLE tmp_input_ids (uuid VARCHAR(64) PRIMARY KEY);
INSERT INTO tmp_input_ids VALUES (...批量插入...);

WITH RECURSIVE tree(uuid, parent_uuid) AS (
    SELECT r.uuid, r.parent_uuid
    FROM resources r
    JOIN tmp_input_ids t ON r.uuid = t.uuid   -- JOIN 替代 IN,走索引

    UNION ALL

    SELECT r.uuid, r.parent_uuid
    FROM resources r
    JOIN tree ON r.parent_uuid = tree.uuid    -- 拆掉 OR,只走 parent_uuid
    WHERE r.uuid NOT IN (SELECT uuid FROM tmp_input_ids)
)
SELECT uuid FROM tree;

root_uuid 那个条件如果是为了"一跳找到所有后代"的优化,在深度已知为 2-4 层时可以去掉,让递归自然展开反而更快。


方案二:锚点去重(减少递归起点)

1万同级节点的父节点数量很少,先收缩锚点:

sql 复制代码
WITH RECURSIVE tree AS (
    -- 只保留"在输入列表中、但父节点不在输入列表中"的节点作为锚点
    SELECT r.uuid, r.parent_uuid
    FROM resources r
    JOIN tmp_input_ids t ON r.uuid = t.uuid
    WHERE r.parent_uuid NOT IN (SELECT uuid FROM tmp_input_ids)
      AND r.parent_uuid IS NOT NULL

    UNION ALL

    SELECT r.uuid, r.parent_uuid
    FROM resources r
    JOIN tree ON r.parent_uuid = tree.uuid
)
SELECT uuid FROM tree
WHERE uuid NOT IN (SELECT uuid FROM tmp_input_ids);  -- 排除输入节点本身

这样锚点从 1 万缩减到实际的"根入口"数量(可能只有几十个)。


方案三:固定层数展开(最适合 2-4 层场景)

深度已知时,直接用 JOIN 展开比递归 CTE 快得多:

sql 复制代码
-- 第1层子节点
SELECT uuid FROM resources WHERE parent_uuid IN (SELECT uuid FROM tmp_input_ids)
  AND uuid NOT IN (SELECT uuid FROM tmp_input_ids)

UNION

-- 第2层
SELECT r2.uuid FROM resources r1
JOIN resources r2 ON r2.parent_uuid = r1.uuid
WHERE r1.parent_uuid IN (SELECT uuid FROM tmp_input_ids)
  AND r2.uuid NOT IN (SELECT uuid FROM tmp_input_ids)

UNION

-- 第3层(如有)
SELECT r3.uuid FROM resources r1
JOIN resources r2 ON r2.parent_uuid = r1.uuid
JOIN resources r3 ON r3.parent_uuid = r2.uuid
WHERE r1.parent_uuid IN (SELECT uuid FROM tmp_input_ids)
  AND r3.uuid NOT IN (SELECT uuid FROM tmp_input_ids)

方案四:应用层分批

如果不能用临时表,在 Java/应用层把 1 万 ID 分成 500 一批,并发查询后合并去重。


推荐组合

场景 推荐
可以建临时表 方案一 + 方案二(锚点去重)
深度严格 ≤ 4 层 方案三(固定展开,最可预测)
只能改应用层 方案四分批 + 结果去重

索引要求

  • resources(parent_uuid) --- 必须存在
  • resources(root_uuid) --- 必须存在
  • uuid --- 主键
相关推荐
IT果果日记3 小时前
人大金仓使用Flink-CDC
大数据·数据库·后端
2301_782040453 小时前
JavaScript中Map在频繁增删键值对场景下的稳定性
jvm·数据库·python
a7963lin3 小时前
Golang怎么用GitLab CI构建_Golang如何编写.gitlab-ci.yml自动化构建流程【教程】
jvm·数据库·python
熊文豪3 小时前
国产数据库的中流砥柱:KingbaseES 高可用集群架构深度解析
数据库·架构
草莓熊Lotso3 小时前
Linux Socket 编程筑基:从底层本质到核心 API,一文吃透 Socket 预备知识
linux·运维·服务器·数据库·c++
字节高级特工4 小时前
MySQL数据库基础与实战指南
数据库·c++·人工智能·后端·mysql·adb
普修罗双战士4 小时前
项目设计-文章系统发布文章完整前后端设计
java·数据库·vue.js·spring boot·git·intellij-idea
lifewange4 小时前
数据库2表设计
数据库