技术栈

top n

howard2005
13 小时前
spark rdd·top n
3.8.4 利用RDD实现分组排行榜本次实战通过 Spark RDD API 实现了一个典型的 分组 Top N 业务场景:计算每位学生的最高分前三名。首先,将原始学生成绩文本(如“张三丰 90”)读取为 RDD,并映射成 (姓名, 分数) 二元组;接着利用 groupByKey() 按姓名分组,将同一学生的多条记录聚合为 (姓名, [分数列表]);随后在每组内对分数降序排列并截取前三,最终以“姓名: 分数1 分数2 分数3”的格式输出。整个流程涵盖了 Spark 核心操作:textFile, map, groupByKey, sortWi
小股虫
1 年前
java·排序算法·top n·top统计
统计可重复列表中的TOP N这种统计top值的情况场景使用的不少,面试过程中也有聊到过这类问题,在这详细介绍一下思路和方案在Java中统计列表中出现次数最多的前N个对象,常见的实现方案及其优缺点如下:
我是有底线的