SQL:窗口函数(Window Functions)

目录

什么是窗口函数?

基本语法结构

常见的窗口函数分类

[1️⃣ 排名类函数](#1️⃣ 排名类函数)

[2️⃣ 聚合类函数(不影响原始行)](#2️⃣ 聚合类函数(不影响原始行))

[3️⃣ 值访问函数](#3️⃣ 值访问函数)

[窗口范围说明(ROWS / RANGE)](#窗口范围说明(ROWS / RANGE))


什么是窗口函数?

窗口函数是一类 SQL 函数,在不分组的情况下,可以对查询结果中的某一"窗口"范围内的数据进行计算。

不同于聚合函数(如 SUM, AVG),窗口函数不会压缩行,而是为每一行返回一个计算值。

基本语法结构

sql 复制代码
<窗口函数>([参数]) OVER (
  [PARTITION BY 子句]
  [ORDER BY 子句]
  [ROWS 或 RANGE 子句]
)
  • PARTITION BY: 把数据分组,每组内独立执行函数(类似 GROUP BY,但不合并行)。

  • ORDER BY: 确定组内数据顺序。

  • ROWS BETWEEN: 精确控制窗口范围(例如:过去3行)。

举例:

sql 复制代码
SELECT 
  department_id,
  employee_id,
  salary,
  RANK() OVER (PARTITION BY department_id ORDER BY salary DESC) AS rank_in_dept
FROM employees;

常见的窗口函数分类

1️⃣ 排名类函数

函数 描述
ROW_NUMBER() 每一组数据中按顺序分配唯一行号
RANK() 同分并列,跳跃排名(如:1,1,3)
DENSE_RANK() 同分不跳(如:1,1,2)
NTILE(n) 将结果分为 n 个桶,每行给出所属桶编号

1.ROW_NUMBER()

意义:按顺序为每行分配一个"唯一编号"。

名称:ROW_NUMBER = 行号。

语法示例:

sql 复制代码
ROW_NUMBER() OVER (PARTITION BY department_id ORDER BY salary DESC) AS row_num

用途:

  • 对每个部门中员工薪资进行唯一编号(常用于分页、去重等)

2.RANK()

意义:返回排名,相同值并列排名,后续名次跳跃。

名称:RANK = 排名。

语法示例:

sql 复制代码
RANK() OVER (PARTITION BY department_id ORDER BY salary DESC) AS rank
salary RANK
1000 1
1000 1
900 3

3.DENSE_RANK()

意义:与 RANK() 类似,但排名连续不跳跃。

名称:DENSE_RANK = 密集排名。

语法示例:

sql 复制代码
DENSE_RANK() OVER (PARTITION BY department_id ORDER BY salary DESC) AS dense_rank
salary DENSE_RANK
1000 1
1000 1
900 2

4. NTILE(n)

意义:将数据平均分成 n 个桶,每行返回桶编号。

名称:NTILE = "N Tile",即"分桶"。

语法示例:

sql 复制代码
NTILE(4) OVER (ORDER BY salary DESC) AS quartile

用途:

  • 按工资水平将员工划分为四个档次(四分位分析)

2️⃣ 聚合类函数(不影响原始行)

函数 描述
SUM(), AVG(), MAX(), MIN() 聚合函数 + 窗口:在窗口范围内计算
COUNT() 窗口内的行数统计

5. SUM(expr)AVG(expr)MAX(expr)MIN(expr)

意义:在窗口内执行聚合计算,但不影响原始行展示。

名称:

  • SUM = 总和

  • AVG = 平均

  • MAX = 最大值

  • MIN = 最小值

语法示例:

sql 复制代码
SUM(salary) OVER (PARTITION BY department_id ORDER BY hire_date) AS running_total

用途:

  • 滚动汇总、组内对比等。

3️⃣ 值访问函数

函数 描述
LAG(expr, n, default) 返回当前行前第 n 行的值
LEAD(expr, n, default) 返回当前行后第 n 行的值
FIRST_VALUE(expr) 窗口中的第一个值
LAST_VALUE(expr) 窗口中的最后一个值

6. LAG(expr, offset, default)

意义:返回当前行的前 N 行的值。

名称:LAG = 滞后。

语法示例:

sql 复制代码
LAG(salary, 1, 0) OVER (PARTITION BY department_id ORDER BY hire_date) AS prev_salary

用途:

  • 分析趋势、比较环比。

7. LEAD(expr, offset, default)

意义:返回当前行的后 N 行的值。

名称:LEAD = 领先。

语法示例:

sql 复制代码
LEAD(salary, 1, 0) OVER (PARTITION BY department_id ORDER BY hire_date) AS next_salary

用途:

  • 预测未来、构建时间序列对比。

8. FIRST_VALUE(expr)

意义:返回窗口中按排序后第一行的值。

名称:FIRST_VALUE = 第一个值。

语法示例:

sql 复制代码
FIRST_VALUE(salary) OVER (PARTITION BY department_id ORDER BY hire_date) AS first_salary

9. LAST_VALUE(expr)

意义:返回窗口中最后一行的值。

名称:LAST_VALUE = 最后一个值。

注意: LAST_VALUE 需要配合 ROWS BETWEEN UNBOUNDED PRECEDING AND UNBOUNDED FOLLOWING 才能获取整个分区最后一行值。

sql 复制代码
LAST_VALUE(salary) OVER (
  PARTITION BY department_id 
  ORDER BY hire_date 
  ROWS BETWEEN UNBOUNDED PRECEDING AND UNBOUNDED FOLLOWING
) AS last_salary

窗口范围说明(ROWS / RANGE)

ROWS基于物理行号

sql 复制代码
ROWS BETWEEN 2 PRECEDING AND CURRENT ROW

RANGE基于值范围

sql 复制代码
RANGE BETWEEN INTERVAL 7 DAY PRECEDING AND CURRENT ROW

常见用途总结

场景 推荐函数
排名 ROW_NUMBER, RANK, DENSE_RANK
对比趋势 LAG, LEAD, FIRST_VALUE, LAST_VALUE
滚动汇总 SUM, AVG, COUNT + ROWS BETWEEN
分段统计 NTILE
时间窗口 RANGE BETWEEN
相关推荐
小陈工33 分钟前
Python Web开发入门(十七):Vue.js与Python后端集成——让前后端真正“握手言和“
开发语言·前端·javascript·数据库·vue.js·人工智能·python
科技小花5 小时前
数据治理平台架构演进观察:AI原生设计如何重构企业数据管理范式
数据库·重构·架构·数据治理·ai-native·ai原生
一江寒逸5 小时前
零基础从入门到精通MySQL(中篇):进阶篇——吃透多表查询、事务核心与高级特性,搞定复杂业务SQL
数据库·sql·mysql
D4c-lovetrain5 小时前
linux个人心得22 (mysql)
数据库·mysql
阿里小阿希6 小时前
CentOS7 PostgreSQL 9.2 升级到 15 完整教程
数据库·postgresql
荒川之神6 小时前
Oracle 数据仓库雪花模型设计(完整实战方案)
数据库·数据仓库·oracle
做个文艺程序员6 小时前
MySQL安全加固十大硬核操作
数据库·mysql·安全
不吃香菜学java6 小时前
Redis简单应用
数据库·spring boot·tomcat·maven
一个天蝎座 白勺 程序猿6 小时前
Apache IoTDB(15):IoTDB查询写回(INTO子句)深度解析——从语法到实战的ETL全链路指南
数据库·apache·etl·iotdb
不知名的老吴6 小时前
Redis的延迟瓶颈:TCP栈开销无法避免
数据库·redis·缓存