窗口函数row_number(),结合OVER子句中的PARTITION BY和ORDER BY,为数据分组内的每一行生成一个唯一的序号。具体分析如下:
函数作用:
row_number():为每个分组内的行分配一个唯一的连续序号(从1开始)。
OVER子句详解:
-
PARTITION BY t1.org_code, t1.customer_code-
将数据按
org_code(机构代码)和customer_code(客户代码) 分组。 -
窗口计算会独立发生在每个分组内。
-
-
ORDER BY t1.id DESC-
在每个分组内,按
id字段降序排列 (即id值最大的排在最前面)。 -
序号分配基于此排序:最大的
id对应rank=1,次大的id对应rank=2,以此类推。
-
结果列名:
- 生成的序号列名为
rank(可在后续查询中通过此名称引用)。
典型使用场景示例:
SELECT *
FROM (
SELECT
t1.*,
ROW_NUMBER() OVER (
PARTITION BY t1.org_code, t1.customer_code
ORDER BY t1.id DESC
) AS rank
FROM your_table t1
) subquery
WHERE rank = 1; -- 获取每个分组内最新的一条记录(id最大)
注意事项:
-
若需要完全去重 (如多行
id相同时只取一条),优先用ROW_NUMBER()。 -
若需保留相同
id的所有记录 ,改用RANK()或DENSE_RANK()。 -
性能:在分区字段(
org_code,customer_code)和排序字段(id)上建立索引可加速计算。