高级sql技巧

高级SQL技巧涵盖了多个方面,包括窗口函数、递归查询、公用表表达式(CTE)、子查询、集合操作等。

一、窗口函数

窗口函数允许用户在一组行(称为窗口)上执行计算,而不会将这些行合并成单个结果行。在处理排名、累计和运行总和等场景中非常有用。

案例

假设有一个员工表(employees),包含员工ID(employee_id)、部门ID(department_id)和薪水(salary)等字段。现在想要查询每个部门内员工的薪水排名、薪水等级(允许并列)和连续等级(不允许并列)。

复制代码
SELECT
    employee_id,
    department_id,
    salary,
    ROW_NUMBER() OVER (PARTITION BY department_id ORDER BY salary DESC) AS row_num,
    RANK() OVER (PARTITION BY department_id ORDER BY salary DESC) AS rank,
    DENSE_RANK() OVER (PARTITION BY department_id ORDER BY salary DESC) AS dense_rank
FROM
    employees;

说明

  • ROW_NUMBER():为每个部门的员工按薪水降序分配一个唯一的序号。
  • RANK():为每个部门的员工按薪水降序分配一个等级,允许并列,并列后的等级会跳过。
  • DENSE_RANK():为每个部门的员工按薪水降序分配一个连续等级,不允许并列。

二、递归查询

递归查询允许用户在一个查询中多次引用同一个表,这在处理树形结构数据(如组织架构、目录结构)时非常有用。

案例

假设有一个员工表(employees),包含员工ID(employee_id)、经理ID(manager_id)等字段。现在想要查询每个员工的所有上级经理,直到最高级经理(没有经理的经理)。

复制代码
WITH RECURSIVE EmployeeCTE AS (
    SELECT
        employee_id,
        manager_id,
        1 AS level
    FROM
        employees
    WHERE
        manager_id IS NULL
    UNION ALL
    SELECT
        e.employee_id,
        e.manager_id,
        ecte.level + 1
    FROM
        employees e
    INNER JOIN
        EmployeeCTE ecte ON e.manager_id = ecte.employee_id
)
SELECT
    employee_id,
    manager_id,
    level
FROM
    EmployeeCTE
ORDER BY
    level,
    employee_id;

说明

  • WITH RECURSIVE EmployeeCTE AS (...):定义一个递归公用表表达式(CTE)。
  • 初始查询部分:选择最高级经理(没有经理的经理)。
  • 递归查询部分:通过内连接将员工表与CTE进行连接,查找每个员工的上级经理,并增加层级(level)。

三、公用表表达式(CTE)

CTE是一种临时的结果集,只在单个查询的执行周期内有效。它有助于使复杂查询更加易读和易维护。

案例

假设有一个销售表(sales),包含员工ID(employee_id)和销售金额(amount)等字段。现在想要查询总销售金额超过10000的员工ID和总销售金额。

复制代码
WITH SalesCTE AS (
    SELECT
        employee_id,
        SUM(amount) AS total_sales
    FROM
        sales
    GROUP BY
        employee_id
)
SELECT
    employee_id,
    total_sales
FROM
    SalesCTE
WHERE
    total_sales > 10000;

说明

  • WITH SalesCTE AS (...):定义一个公用表表达式(CTE),计算每个员工的总销售金额。
  • 在主查询中引用CTE,并筛选总销售金额超过10000的员工。

四、子查询

子查询是嵌套在另一个查询中的查询,常用于筛选条件和数据过滤。

案例

假设有一个员工表(employees),包含员工ID(employee_id)和薪水(salary)等字段。现在想要查询薪水高于公司平均薪水的员工ID和薪水。

复制代码
SELECT
    employee_id,
    salary
FROM
    employees
WHERE
    salary > (SELECT AVG(salary) FROM employees);

说明

  • 子查询 (SELECT AVG(salary) FROM employees):计算公司平均薪水。
  • 主查询筛选薪水高于平均薪水的员工。

五、集合操作

集合操作允许用户将两个或多个查询结果集进行合并或比较。常见的集合操作符包括UNION、INTERSECT和EXCEPT。

案例

假设有两个表:客户表(customers)和供应商表(suppliers),都包含姓名(name)字段。现在想要查询所有客户和供应商的姓名(去重),以及同时是客户和供应商的姓名,还有只是客户的姓名(不是供应商)。

复制代码
-- 合并两个查询结果集(去重)
SELECT name FROM customers
UNION
SELECT name FROM suppliers;

-- 找出两个查询结果集的交集
SELECT name FROM customers
INTERSECT
SELECT name FROM suppliers;

-- 找出只在第一个查询结果集中存在的记录
SELECT name FROM customers
EXCEPT
SELECT name FROM suppliers;

说明

  • UNION:合并两个查询结果集,并去除重复记录。
  • INTERSECT:找出两个查询结果集的交集,即同时出现在两个结果集中的记录,并去除重复记录。
  • EXCEPT:找出只在第一个查询结果集中存在的记录,即出现在第一个结果集中但不出现在第二个结果集中的记录,并去除重复记录。

总结

这些高级SQL技巧在实际应用中非常有用,能够帮助开发者更高效地处理复杂的数据查询和分析任务。

相关推荐
企服AI产品测评局14 小时前
Agent适配信创环境实测:企业级自动化如何实现国产操作系统与数据库全兼容?
运维·数据库·人工智能·ai·chatgpt·自动化
cfm_291415 小时前
Redis数据安全性解析
数据库·redis·缓存
DIY源码阁15 小时前
JavaSwing学生成绩管理系统 - MySQL版
java·数据库·mysql·eclipse
NiceCloud喜云16 小时前
Claude Code Routines 实战:三种触发器跑通云端自动化编码
android·运维·数据库·人工智能·自动化·json·飞书
辞忧九千七16 小时前
Redis 单机一主二从主从复制完整搭建指南
数据库·redis·缓存
lzhdim16 小时前
SQL 入门 16:SQL 事务隔离级别与死锁解析(易懂)
数据库·sql
AI 小老六17 小时前
Claude Code 如何压缩上下文:Microcompact、Prompt Cache 与 cache_edits 工程拆解
数据库·人工智能·ai·语言模型·架构·系统架构
Chasing__Dreams17 小时前
Redis--基础知识点--32--redis底层存储结构
数据库·redis·缓存
不总是18 小时前
[2026最新] Windows 免安装版 MySQL 8 详细安装配置教程(ZIP 压缩包版)
数据库·windows·mysql
tedcloud12318 小时前
DBX部署教程:打造支持AI SQL助手的数据库管理环境
数据库·人工智能·sql