Mysql8.0 推出的强大功能 窗口函数(Window Functions)

🧠 一、什么是窗口函数?

窗口函数是 SQL 中一种在保留原始行的基础上,对行进行分组排序后执行聚合、排名、累计等计算的方法。

与传统的 GROUP BY 聚合不同的是:

👉 窗口函数不会把多行聚成一行,而是为每一行都保留详细信息并加上一个"窗口内"的计算结果。


🧾 二、窗口函数的语法

sql 复制代码
WINDOW_FUNCTION() OVER ( 

    PARTITION BY column1 ORDER BY column2 ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW 

)

🧱 组成部分详解:

语法部分 说明
WINDOW_FUNCTION() 执行的函数,如 SUM()AVG()ROW_NUMBER()
PARTITION BY 窗口分组,像 GROUP BY,将数据按这个字段分成一个一个"窗口"
ORDER BY 窗口内的排序逻辑,很多函数必须指定排序顺序
ROWS BETWEEN 控制窗口的范围(行数范围)

🧰 三、常见窗口函数

基本上就是我们日常使用的一些函数

函数名 用途
ROW_NUMBER() 每行编号(分组后从1开始)
RANK() / DENSE_RANK() 排名
SUM(col) 累加
AVG(col) 移动平均
LAG(col) / LEAD(col) 前一行/后一行值

🧪 四、实战讲解

4.1 小例子

首先我们先搞一个基础的测试表,类型顺序打乱,

基础需求就是 每一个类型在每一时刻都有一个score,我们始终以id最新的为准,然后我们想要计算,某一时刻,score的累计值 , 表如下:

窗口函数如下

sql 复制代码
WITH test_sum AS(

SELECT id ,
	   TYPE,
	   sum(score) OVER (PARTITION BY TYPE ORDER BY id ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW ) AS col_score
	   FROM test 
)

SELECT * FROM test_sum;
1. WITH 子句(公用表表达式)

WITH test_sum AS (...) 是一个 公用表表达式 (CTE),它用于定义一个临时的结果集,并将其命名为 test_sum。然后,我们可以在后续的查询中引用这个临时结果集。这个查询的 主要作用 是计算一个分组中的每个记录的滚动平均 score

2. 内部 SELECT 查询的部分解释
sql 复制代码
SELECT id, TYPE, AVG(score) OVER 
(PARTITION BY TYPE ORDER BY id ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW) 
AS col_score FROM test

这部分查询涉及到以下几个部分:

(1)字段选择:
  • idTYPE:查询的字段是 idTYPE,这些字段会出现在最终的结果中。

  • AVG(score)AVG() 是一个聚合函数,用于计算某一列的平均值。在这里它用于计算每个分组内的 score 平均值。

(2)窗口函数 SUM() OVER (...)
  • SUM(score) :计算窗口范围内的 score 总值。

  • OVER (...) :这里的 OVER 关键字表示窗口函数,用于在指定的窗口范围内执行 SUM() 聚合计算。

(3)PARTITION BY TYPE
  • 通过 PARTITION BY TYPE,我们将数据分成不同的 (即按 TYPE 列分组)。每个分组内的数据会独立进行窗口函数的计算。

    • 举例 :如果 TYPE 有值 AB,那么 AVG(score) 会分别计算 TYPE = ATYPE = B 两个分组中的平均值。
(4)ORDER BY id
  • ORDER BY id 指定了每个分组内部的排序规则,按照 id 字段进行排序。排序后,窗口函数会根据这个排序进行计算。

    • 举例 :假设分组后的数据按 id 排序(从小到大),AVG() 会根据这个顺序进行滚动计算。
(5)ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW
  • ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW 定义了窗口的范围:

    • UNBOUNDED PRECEDING:表示从分组的第一行开始。

    • CURRENT ROW:表示窗口的结束是当前行

4.2 计算交易流水

需求 按照id 从小到大, 计算每一个账户的最终 balance ,并体现在该账户id最大的那条数据的balance中 ,期间每一个balance都要 计算出来当时的 balance,credit是加 , debit是减

有了上面的铺垫,所以这里就直接上SQL

sql 复制代码
WITH balance_calculation AS (
    SELECT 
        id,
        account_code,
        credit_amount,
        debit_amount,
        -- 计算余额:按账户分组,按流水创建时间排序,前一行余额 + 当前行的 credit_amount - debit_amount
        SUM(credit_amount - debit_amount) OVER (PARTITION BY account_code ORDER BY create_at  ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW) AS balance
    FROM tbl_posting_line
)
-- 更新最终的 balance
UPDATE tbl_posting_line t
JOIN balance_calculation bc ON t.id = bc.id
SET t.balance = bc.balance;

📌 五、窗口函数 VS 聚合函数

对比点 聚合函数(GROUP BY 窗口函数(OVER(...)
是否保留原始行 ❌ 会合并 ✅ 会保留
适合做什么 汇总统计报表 排名、累计、滑动统计
支持列 限制较多 更灵活
复杂分析 一般 更强大

📦 六、窗口函数常用场景

场景 示例函数
排名 RANK(), ROW_NUMBER()
累计金额 SUM(...) OVER(...)
环比分析 LAG(), LEAD()
分组内排序 ROW_NUMBER()
分组内前N ROW_NUMBER() + WHERE

✅ 七、使用注意事项

  1. 需要 MySQL 8.0+

  2. UPDATE JOIN 中要小心更新逻辑(务必用唯一标识如 id);

  3. OVER() 不能用于 WHERE,但可以用于 CTE 或子查询;

  4. 如果性能是关键,建议先试试窗口函数效率 vs 存储过程。

相关推荐
AI军哥18 分钟前
MySQL8的安装方法
人工智能·mysql·yolo·机器学习·deepseek
小光学长35 分钟前
基于vue框架的电信用户业务管理系统的设计与实现8ly70(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。
数据库
程序员不想YY啊1 小时前
MySQL元数据库完全指南:探秘数据背后的数据
数据库·mysql·oracle
数据最前线1 小时前
Doris表设计与分区策略:让海量数据管理更高效
数据库
时光追逐者1 小时前
MongoDB从入门到实战之MongoDB快速入门(附带学习路线图)
数据库·学习·mongodb
头顶秃成一缕光1 小时前
Redis的主从模式和哨兵模式
数据库·redis·缓存
AIGC大时代1 小时前
高效使用DeepSeek对“情境+ 对象 +问题“型课题进行开题!
数据库·人工智能·算法·aigc·智能写作·deepseek
博睿谷IT99_1 小时前
数据库证书可以选OCP认证吗?
数据库·oracle·开闭原则·ocp认证
乐维_lwops2 小时前
数据库监控 | MongoDB监控全解析
数据库·mongodb·数据库监控
观无2 小时前
Redis安装及入门应用
数据库·redis·缓存