MySQL递归查询:洞悉数据的层层关联

在处理关系型数据库时,我们经常会遇到这样的情况:某些数据之间存在层级关系,例如目录、组织结构、评论等。在这些场景下,我们需要一种灵活的查询技术来处理这种层级关系。今天我们就来探讨MySQL中的递归查询,体验其独特的魅力,并展示两个实用的示例。

目录

一、递归查询简介

二、递归查询的基本语法

三、MySQL递归查询示例

四、递归查询的另一个应用


一、递归查询简介

递归查询是一种在数据库中处理具有层次结构的数据的方法,它使用带有自连接的表和公共表表达式(Common Table Expression,简称CTE),让我们可以在一个表中查询出具有父子关系的数据。在MySQL中,我们可以使用WITH RECURSIVE语句来实现递归查询。

二、递归查询的基本语法

在MySQL中,递归查询的基本语法如下:

WITH RECURSIVE cte_name (列1, 列2, ...) AS  (  
    -- 非递归部分,用于初始化cte(公共表表达式)
    SELECT 列1, 列2, ... FROM 表名 WHERE 初始查询条件

    UNION ALL  

    -- 递归部分,用于扩展cte
    SELECT 列1, 列2, ... FROM 表名 WHERE ...
)  
SELECT 列1, 列2, ... FROM cte_name;

WITH RECURSIVE:这是递归查询的关键字,用于定义递归查询。

cte_name:这是为递归查询定义的名称,方便后续引用。

三、MySQL递归查询示例

下面是一个简单的示例,演示如何使用MySQL进行递归查询。假设我们有一个包含员工和他们的上级的表,如下所示:​​​​​​​

CREATE TABLE employees (
    id INT PRIMARY KEY,
    name VARCHAR(100),
    manager_id INT,
    FOREIGN KEY (manager_id) REFERENCES employees (id)
);

插入测试数据:​​​​​​​

INSERT INTO employees (id, name, manager_id)
VALUES (1, '张三', NULL),
    (2, '李四', 1),
    (3, '王五', 2),
    (4, '赵六', 2),
    (5, '孙七', 3),
    (6, '周八', 3),
    (7, '吴九', 5),
    (8, '郑十', 6);

我们的需求是查找某个特定员工的所有下级。通过递归查询实现:

WITH RECURSIVE emp AS (
    SELECT id, name, manager_id
    FROM employees
    WHERE name = '王五'
    UNION ALL
    SELECT e.id, e.name, e.manager_id
    FROM employees e, emp
    WHERE e.manager_id = emp.id
)
SELECT id, name FROM emp;

得到的结果如图:

这个示例中的查询它包含两个部分:非递归部分和递归部分。非递归部分是从员工表中选择某个员工,递归部分是通过与公共表表达式进行连接从员工表中选择下属员工。最后,从公共表表达式中查询整个员工层级结构。

四、递归查询的另一个应用

使用递归查询可以生成指定数量的序列,如下SQL生成1~10的序列:

WITH RECURSIVE seq(seq_no) AS (
    SELECT 1
    UNION ALL
    SELECT 1 + seq_no FROM seq WHERE seq_no < 10)
SELECT * FROM seq;

​​​​​​​

那么,生成这个序列有什么用呢?有很多场景需要用到这种序列,如:统计每年在校学生人数。

假设有一个招生人数表,记录了每年招生人数和学生学制等信息,现需要统计每年在校学生人数。

我们仍然使用Excel表格辅助分析,为该问题编写SQL,先在Excel里面输入样例数据:

先统一约定,假设本例中的统计时间为下半年,即:某一入学年度的招生人数,会统计到在校人数中,当年毕业的学生,不会统计到在校人数中。

为了统计某一年在校学生人数,我们在该数据后面添加辅助数据,比如统计2023年在校学生人数,填入如下数据:

学生在校状态,是根据入学年度和学制计算出毕业时间,然后与统计年度进行比较得出。筛选出状态为在校的数据然后求和即可。

但本次的需求是统计每年在校学生人数,也就是需要为每一个统计年度生成这样的数据,如下图所示:

分析这些数据的规律,某一入学年度的数据,在入学年度及之后的每一个统计年度中,如果该入学年度的学生在校,则该数据需要出现在该统计年度中,学生在校多少年,该入学年度的数据就会出现多少次。而连续的统计年度,就是一个序列!

用以下SQL模拟招生人数表数据:

SELECT 2020 year, 300 enrollment, 3 length_of_schooling
UNION ALL SELECT 2021, 400, 4
UNION ALL SELECT 2022, 400, 4
UNION ALL SELECT 2023, 400, 4

​​​​​​​

将该数据与递归产生的序列连接,就可以得到前面需要的每一个统计年度的招生数据。为便于计算统计年度,序列从0开始,序列最大值为学制最大值:

WITH RECURSIVE seq(seq_no) AS (
    SELECT 0
    UNION ALL
    SELECT 1 + seq_no FROM seq WHERE seq_no < 4
), cnt AS (
    SELECT 2020 enro_year, 300 enrollment, 3 length_of_schooling
    UNION ALL SELECT 2021, 400, 4
    UNION ALL SELECT 2022, 400, 4
    UNION ALL SELECT 2023, 400, 4)
SELECT cnt.*, enro_year + seq_no stat_year,
    IF(seq_no < length_of_schooling, '在校', '毕业') status
FROM cnt, seq
-- WHERE seq_no < length_of_schooling
ORDER BY enro_year + seq_no, enro_year;

​​​​​​​

只需要将上述SQL稍做修改,按统计年度分组统计,就可以得到每年的在校学生人数:

WITH RECURSIVE seq(seq_no) AS (
    SELECT 0
    UNION ALL
    SELECT 1 + seq_no FROM seq WHERE seq_no < 4
), cnt AS (
    SELECT 2020 enro_year, 300 enrollment, 3 length_of_schooling
    UNION ALL SELECT 2021, 400, 4
    UNION ALL SELECT 2022, 400, 4
    UNION ALL SELECT 2023, 400, 4)
SELECT enro_year + seq_no stat_year, sum(enrollment) stu_enrollment 
FROM cnt, seq
WHERE seq_no < length_of_schooling
GROUP BY enro_year + seq_no
ORDER BY enro_year + seq_no;

​​​​​​​

得到的结果如图:

通过使用递归查询,我们可以轻松地解决一些传统查询方法难以处理的问题。通过本文的介绍和示例,希望能够帮助大家更好地理解和应用MySQL中的递归查询。

相关推荐
hmbbpdx9 分钟前
MySql B树 B+树
数据库·b树·mysql
编程阿布25 分钟前
Python基础——多线程编程
java·数据库·python
冰镇毛衣27 分钟前
4.5 数据表的外连接
数据库·sql·mysql
又蓝27 分钟前
使用 Python 操作 MySQL 数据库的实用工具类:MySQLHandler
数据库·python·mysql
庄小焱33 分钟前
Java开发经验——数据库开发经验
数据库·系统设计·代码重构
开心工作室_kaic33 分钟前
springboot498基于javaweb的宠物猫认养系统(论文+源码)_kaic
java·开发语言·数据库·美食
跨境商城搭建开发39 分钟前
一个服务器可以搭建几个网站?搭建一个网站的流程介绍
运维·服务器·前端·vue.js·mysql·npm·php
mqiqe44 分钟前
Linux 安装rpm
linux·运维·数据库
海绵波波1071 小时前
flask后端开发(8):Flask连接MySQL数据库+ORM增删改查
数据库·mysql·flask
凡人的AI工具箱1 小时前
每天40分玩转Django:Django文件上传
开发语言·数据库·后端·python·django