窗口函数row_number()
,结合OVER
子句中的PARTITION BY
和ORDER BY
,为数据分组内的每一行生成一个唯一的序号。具体分析如下:
函数作用:
row_number()
:为每个分组内的行分配一个唯一的连续序号(从1开始)。
OVER
子句详解:
-
PARTITION BY t1.org_code, t1.customer_code
-
将数据按
org_code
(机构代码)和customer_code
(客户代码) 分组。 -
窗口计算会独立发生在每个分组内。
-
-
ORDER BY t1.id DESC
-
在每个分组内,按
id
字段降序排列 (即id
值最大的排在最前面)。 -
序号分配基于此排序:最大的
id
对应rank=1
,次大的id
对应rank=2
,以此类推。
-
结果列名:
- 生成的序号列名为
rank
(可在后续查询中通过此名称引用)。
典型使用场景示例:
SELECT *
FROM (
SELECT
t1.*,
ROW_NUMBER() OVER (
PARTITION BY t1.org_code, t1.customer_code
ORDER BY t1.id DESC
) AS rank
FROM your_table t1
) subquery
WHERE rank = 1; -- 获取每个分组内最新的一条记录(id最大)
注意事项:
-
若需要完全去重 (如多行
id
相同时只取一条),优先用ROW_NUMBER()
。 -
若需保留相同
id
的所有记录 ,改用RANK()
或DENSE_RANK()
。 -
性能:在分区字段(
org_code
,customer_code
)和排序字段(id
)上建立索引可加速计算。