Spark组件架构主要采用主从结构,分别是driver驱动器,Excutor执行器,和cluster Manager集群管理器这个三个架构组件
其中driver驱动器主要负责spark执行Excutor的任务分配。
Excutor执行器猪獒就是负责将被分配到的task任务进行处理
claster manager管理有多钟:
第一种的spark自带的的集群管理,叫做standalone。
第二种是spark on yarn,就是将任务字段给到apache yarn进行资源调度管理。
第三种是spark on meoss,meoss是一种类似于yarn的集群资源管理,在国外用的比较常见。