【sql高级】postgresql之窗口函数用法

1. 背景

窗口函数在在SQL中是非常有用的工具,特别是在需要对查询结果进行分析、排名、聚合或者对结果进行一些特定的计算时。以下是一些常见的场景:

  1. 排名和分组:窗口函数可以轻松地对结果集进行排名、分组和分区。例如,你可以使用 ROW_NUMBER()、RANK()、DENSE_RANK() 等函数来为每一行分配一个排名值,而不需要对查询结果进行额外的子查询或者连接操作。

  2. 移动平均和累计求和:窗口函数可以用来计算移动平均、累计求和或者其他一些基于窗口的聚合函数。这种功能对于时间序列分析或者趋势分析非常有用。

  3. Top N 查询:通过使用窗口函数,你可以很容易地实现Top N查询,即获取每个分组或者分区中前N个值。这在很多业务场景下都是非常有用的,比如获取每个类别的前几名产品。

  4. 比较当前行和前/后行:有些情况下,你可能需要比较当前行和前一行或者后一行的数据。窗口函数可以帮助你实现这样的需求,比如计算当前行与上一行的差值或者比率等。

  5. 处理重叠区间:在处理时间区间或者其他类型的重叠区间时,窗口函数可以帮助你轻松地识别和处理这些重叠的区间。

  6. 执行复杂的聚合操作:有时候,你可能需要对聚合操作的结果进行更复杂的处理,比如计算每个分组内的平均值,然后将每个值与该分组内的所有值进行比较。窗口函数可以帮助你在不增加额外的查询复杂度的情况下实现这些功能。

2. 使用举例

dim.dim_mltt_trading_sequence_i表中有如下数据:

使用窗口函数 ROW_NUMBER() 可以对sequence_id、unit_id、center_id这三个字段相同的数据进行排序(按id排序)

使用的sql如下:

sql 复制代码
select
    t7.*,
    ROW_NUMBER() OVER (PARTITION BY t7.sequence_id,
        t7.unit_id, t7.center_id ORDER BY t7.id) as rn
from
        dim.dim_mltt_trading_sequence_i t7;

输出结果如下:

相关推荐
Dontla21 分钟前
Python asyncpg库介绍(基于Python asyncio的PostgreSQL数据库驱动)连接池、SQLAlchemy
数据库·python·postgresql
俺不要写代码21 分钟前
数据库:DQL
数据库·sql·mysql
zh15702329 分钟前
如何编写动态SQL存储过程_使用sp_executesql执行灵活查询
jvm·数据库·python
2401_8242226933 分钟前
SQL报表统计数据量巨大_分批统计策略
jvm·数据库·python
俺不要写代码34 分钟前
数据库:DCL
数据库
X566136 分钟前
mysql如何处理连接数过多报错_调整max_connections参数
jvm·数据库·python
学习3人组1 小时前
OEE(设备综合效率)的标准定义、公式、损失分类、以及在工位触屏/MES里怎么采集和统计
大数据·网络·数据库
张~颜1 小时前
PostgreSQL数据压缩技术
数据库·postgresql
m0_609160491 小时前
MongoDB中什么是Hashed Shard Key的哈希冲突_哈希函数的分布均匀性分析
jvm·数据库·python
小碗羊肉1 小时前
【MySQL | 第十一篇】InnoDB引擎
java·数据库·mysql