技术栈
sparkcore
有语忆语
1 年前
spark
·
rdd
·
sparkcore
SparkCore基础解析(二)
RDD(Resilient Distributed Dataset)叫做分布式数据集,是Spark中最基本的数据抽象。代码中是一个抽象类,它代表一个不可变、可分区、里面的元素可并行计算的集合。