技术栈

collect

XueminXu
4 天前
spark·cache·map·rdd·flatmap·弹性分布式数据集·collect
Spark引擎中RDD的性质RDD(Resilient Distributed Dataset,弹性分布式数据集)是SparkCore提供的核心抽象。一个RDD在逻辑上抽象地代表了一个HDFS文件或数据库中的表,但RDD是被分区的,每个分区分布在不同的节点上,从而并行执行。
我是有底线的