技术栈
spark rdd
夜夜流光相皎洁_小宁
4 个月前
弹性分布式数据集
·
apache spark
·
spark rdd
·
rdd持久化
·
rdd partition分区
Spark 分布式弹性计算集(RDD)相关概念介绍
目录一、概述二、RDD的核心概念2.1 Partition2.2 Partitioner2.3 RDD的依赖关系
howard2005
4 个月前
topn
·
spark rdd
任务3.8.4 利用RDD实现分组排行榜
在大数据环境下,经常需要对数据进行分组和排序操作。本实战任务旨在利用Apache Spark的RDD(弹性分布式数据集)来实现对学生成绩数据的分组,并求出每个学生分数最高的前3个成绩。
howard2005
5 个月前
词频统计
·
spark rdd
任务3.8.1 利用RDD实现词频统计
选择实现方式Spark版本与Scala版本匹配JDK版本选择启动服务文件准备分步实现一步实现创建Maven项目