Hive分组排序取topN的sql查询示例

Hive分组排序取topN的sql查询示例

要在Hive中实现分组排序并取每组的前N条记录,可以使用 ROW_NUMBER() 窗口函数结合 PARTITION BY 和 ORDER BY 子句。

以下是一个示例SQL查询,用于选择每个部门中工资最高的前3名员工:

c 复制代码
SELECT department, employee_id, employee_name, salary
FROM (
         SELECT
             department,
             employee_id,
             employee_name,
             salary,
             ROW_NUMBER() OVER (PARTITION BY department ORDER BY salary DESC) as rn
         FROM employee
     ) ranked
WHERE rn <= 3;

在这个SQL查询中:

  • 内部查询根据工资降序为每个部门中的员工分配一个行号。
  • 外部查询将结果筛选为每个部门中的前3名员工(行号为1、2、3)。

您可以根据需要调整 rn <= 3 条件来选择不同数量的前N条记录。这个查询将为您提供每个分组中的前N条记录。

相关推荐
xiaoduo AI4 分钟前
客服机器人首响时长最快可优化至几秒?智能 Agent 预加载常用语,响应比人工快多少?
大数据·人工智能·机器人
Francek Chen11 分钟前
【大数据存储与管理】NoSQL数据库:02 NoSQL兴起的原因
大数据·数据库·分布式·nosql
做萤石二次开发的哈哈15 分钟前
智能AI云存储|萤石蓝海大模型加持,解锁视频数据新价值
大数据·人工智能
用户48159301959119 分钟前
四大厂商突然集体站队 Iceberg v3,我花一周搞清楚了为什么
大数据
武子康42 分钟前
大数据-267 实时数仓-架构演进:Lambda与Kappa架构实战指南
大数据·后端
永霖光电_UVLED43 分钟前
纳米级精度可视化微生物与衰老大脑细胞之间的相互作用
大数据·人工智能·物联网·汽车·娱乐
Vin0sen1 小时前
Hadoop安装
大数据·hadoop·分布式
weixin_549808361 小时前
从“工具辅助”到“智能自主”:易薪路(eRoad) AI 招聘系统的范式革命与实战重构
大数据·人工智能·重构
豆豆1 小时前
高校网站群集约化建设与运营解决方案
大数据·cms·信创·解决方案·网站管理系统·站群cms·高校站群
YSyuanshuo1 小时前
2026滴鸡精品牌指南:羽本元如何用技术革新挑战传统老牌?
大数据·python