技术栈
collect
XueminXu
4 天前
spark
·
cache
·
map
·
rdd
·
flatmap
·
弹性分布式数据集
·
collect
Spark引擎中RDD的性质
RDD(Resilient Distributed Dataset,弹性分布式数据集)是SparkCore提供的核心抽象。一个RDD在逻辑上抽象地代表了一个HDFS文件或数据库中的表,但RDD是被分区的,每个分区分布在不同的节点上,从而并行执行。
我是有底线的