Spark实现WorldCount执行流程图

spark可以分区并行执行,同时并行执行也可以基于内存完成迭代

代码

对于大部分spark程序来说都是以driver开始driver结束,中间都是executor分布式运行