MySQL递归查询:洞悉数据的层层关联

在处理关系型数据库时,我们经常会遇到这样的情况:某些数据之间存在层级关系,例如目录、组织结构、评论等。在这些场景下,我们需要一种灵活的查询技术来处理这种层级关系。今天我们就来探讨MySQL中的递归查询,体验其独特的魅力,并展示两个实用的示例。

目录

一、递归查询简介

二、递归查询的基本语法

三、MySQL递归查询示例

四、递归查询的另一个应用


一、递归查询简介

递归查询是一种在数据库中处理具有层次结构的数据的方法,它使用带有自连接的表和公共表表达式(Common Table Expression,简称CTE),让我们可以在一个表中查询出具有父子关系的数据。在MySQL中,我们可以使用WITH RECURSIVE语句来实现递归查询。

二、递归查询的基本语法

在MySQL中,递归查询的基本语法如下:

WITH RECURSIVE cte_name (列1, 列2, ...) AS  (  
    -- 非递归部分,用于初始化cte(公共表表达式)
    SELECT 列1, 列2, ... FROM 表名 WHERE 初始查询条件

    UNION ALL  

    -- 递归部分,用于扩展cte
    SELECT 列1, 列2, ... FROM 表名 WHERE ...
)  
SELECT 列1, 列2, ... FROM cte_name;

WITH RECURSIVE:这是递归查询的关键字,用于定义递归查询。

cte_name:这是为递归查询定义的名称,方便后续引用。

三、MySQL递归查询示例

下面是一个简单的示例,演示如何使用MySQL进行递归查询。假设我们有一个包含员工和他们的上级的表,如下所示:​​​​​​​

CREATE TABLE employees (
    id INT PRIMARY KEY,
    name VARCHAR(100),
    manager_id INT,
    FOREIGN KEY (manager_id) REFERENCES employees (id)
);

插入测试数据:​​​​​​​

INSERT INTO employees (id, name, manager_id)
VALUES (1, '张三', NULL),
    (2, '李四', 1),
    (3, '王五', 2),
    (4, '赵六', 2),
    (5, '孙七', 3),
    (6, '周八', 3),
    (7, '吴九', 5),
    (8, '郑十', 6);

我们的需求是查找某个特定员工的所有下级。通过递归查询实现:

WITH RECURSIVE emp AS (
    SELECT id, name, manager_id
    FROM employees
    WHERE name = '王五'
    UNION ALL
    SELECT e.id, e.name, e.manager_id
    FROM employees e, emp
    WHERE e.manager_id = emp.id
)
SELECT id, name FROM emp;

得到的结果如图:

这个示例中的查询它包含两个部分:非递归部分和递归部分。非递归部分是从员工表中选择某个员工,递归部分是通过与公共表表达式进行连接从员工表中选择下属员工。最后,从公共表表达式中查询整个员工层级结构。

四、递归查询的另一个应用

使用递归查询可以生成指定数量的序列,如下SQL生成1~10的序列:

WITH RECURSIVE seq(seq_no) AS (
    SELECT 1
    UNION ALL
    SELECT 1 + seq_no FROM seq WHERE seq_no < 10)
SELECT * FROM seq;

​​​​​​​

那么,生成这个序列有什么用呢?有很多场景需要用到这种序列,如:统计每年在校学生人数。

假设有一个招生人数表,记录了每年招生人数和学生学制等信息,现需要统计每年在校学生人数。

我们仍然使用Excel表格辅助分析,为该问题编写SQL,先在Excel里面输入样例数据:

先统一约定,假设本例中的统计时间为下半年,即:某一入学年度的招生人数,会统计到在校人数中,当年毕业的学生,不会统计到在校人数中。

为了统计某一年在校学生人数,我们在该数据后面添加辅助数据,比如统计2023年在校学生人数,填入如下数据:

学生在校状态,是根据入学年度和学制计算出毕业时间,然后与统计年度进行比较得出。筛选出状态为在校的数据然后求和即可。

但本次的需求是统计每年在校学生人数,也就是需要为每一个统计年度生成这样的数据,如下图所示:

分析这些数据的规律,某一入学年度的数据,在入学年度及之后的每一个统计年度中,如果该入学年度的学生在校,则该数据需要出现在该统计年度中,学生在校多少年,该入学年度的数据就会出现多少次。而连续的统计年度,就是一个序列!

用以下SQL模拟招生人数表数据:

SELECT 2020 year, 300 enrollment, 3 length_of_schooling
UNION ALL SELECT 2021, 400, 4
UNION ALL SELECT 2022, 400, 4
UNION ALL SELECT 2023, 400, 4

​​​​​​​

将该数据与递归产生的序列连接,就可以得到前面需要的每一个统计年度的招生数据。为便于计算统计年度,序列从0开始,序列最大值为学制最大值:

WITH RECURSIVE seq(seq_no) AS (
    SELECT 0
    UNION ALL
    SELECT 1 + seq_no FROM seq WHERE seq_no < 4
), cnt AS (
    SELECT 2020 enro_year, 300 enrollment, 3 length_of_schooling
    UNION ALL SELECT 2021, 400, 4
    UNION ALL SELECT 2022, 400, 4
    UNION ALL SELECT 2023, 400, 4)
SELECT cnt.*, enro_year + seq_no stat_year,
    IF(seq_no < length_of_schooling, '在校', '毕业') status
FROM cnt, seq
-- WHERE seq_no < length_of_schooling
ORDER BY enro_year + seq_no, enro_year;

​​​​​​​

只需要将上述SQL稍做修改,按统计年度分组统计,就可以得到每年的在校学生人数:

WITH RECURSIVE seq(seq_no) AS (
    SELECT 0
    UNION ALL
    SELECT 1 + seq_no FROM seq WHERE seq_no < 4
), cnt AS (
    SELECT 2020 enro_year, 300 enrollment, 3 length_of_schooling
    UNION ALL SELECT 2021, 400, 4
    UNION ALL SELECT 2022, 400, 4
    UNION ALL SELECT 2023, 400, 4)
SELECT enro_year + seq_no stat_year, sum(enrollment) stu_enrollment 
FROM cnt, seq
WHERE seq_no < length_of_schooling
GROUP BY enro_year + seq_no
ORDER BY enro_year + seq_no;

​​​​​​​

得到的结果如图:

通过使用递归查询,我们可以轻松地解决一些传统查询方法难以处理的问题。通过本文的介绍和示例,希望能够帮助大家更好地理解和应用MySQL中的递归查询。

相关推荐
Ai 编码助手1 小时前
MySQL中distinct与group by之间的性能进行比较
数据库·mysql
陈燚_重生之又为程序员2 小时前
基于梧桐数据库的实时数据分析解决方案
数据库·数据挖掘·数据分析
caridle2 小时前
教程:使用 InterBase Express 访问数据库(五):TIBTransaction
java·数据库·express
白云如幻2 小时前
MySQL排序查询
数据库·mysql
萧鼎2 小时前
Python并发编程库:Asyncio的异步编程实战
开发语言·数据库·python·异步
^velpro^2 小时前
数据库连接池的创建
java·开发语言·数据库
苹果醋32 小时前
Java8->Java19的初步探索
java·运维·spring boot·mysql·nginx
荒川之神2 小时前
ORACLE _11G_R2_ASM 常用命令
数据库·oracle
IT培训中心-竺老师2 小时前
Oracle 23AI创建示例库
数据库·oracle
小白学大数据2 小时前
JavaScript重定向对网络爬虫的影响及处理
开发语言·javascript·数据库·爬虫