rdd.glom()
对rdd的数据进行嵌套,嵌套按照分区来进行
cpp
rdd = sc.parallelize([1, 2, 3, 4, 5, 6, 7, 8, 9], 2)
print(rdd.glom().collect())
输出:[[1,2,3,4],[5,6,7,8,9]]
对rdd的数据进行嵌套,嵌套按照分区来进行
rdd = sc.parallelize([1, 2, 3, 4, 5, 6, 7, 8, 9], 2)
print(rdd.glom().collect())
输出:[[1,2,3,4],[5,6,7,8,9]]