spark运行流程

spark运行流程

  1. 任务提交后,先启动 Driver 程序
  2. 随后 Driver 向集群管理器注册应用程序
  3. 集群管理器根据此任务的配置文件分配 Executor 并启动
  4. Driver 开始执行 main 函数,Spark 查询为懒执行,当执行到 Action 算子时开始反向推
    算,根据宽依赖进行 Stage 的划分,随后每一个 Stage 对应一个 Taskset,Taskset 中有多个 Task
  5. 查找可用资源 Executor 进行调度
  6. 根据本地化原则,Task 会被分发到指定的 Executor 去执行
  7. 任务执行的过程中,Executor 也会不断与 Driver 进行通信,报告任务运行情况
    进行通信,报告任务运行情况
相关推荐
TDengine (老段)几秒前
TDengine Go 语言连接器进阶指南
大数据·数据库·物联网·golang·时序数据库·tdengine·涛思数据
~央千澈~1 分钟前
从阅文招聘JD看网文平台算法化-网文平台拥抱科技·卓伊凡
大数据·人工智能
房产中介行业研习社2 分钟前
2026年1月房产中介管理系统哪家好用
大数据·人工智能
deepdata_cn3 分钟前
零售门店:浅数据看客流,大数据看区域,深数据挖消费动机
大数据·零售·深数据·浅数据
Knight_AL10 分钟前
深入理解:RabbitMQ 中的 ACK / NACK 有什么区别?
分布式·rabbitmq
xiatianxy10 分钟前
登高作业安全难题如何破?
大数据·人工智能·科技·物联网·安全·智能安全带
七夜zippoe16 分钟前
RabbitMQ与Celery深度集成:构建高性能Python异步任务系统
分布式·python·rabbitmq·celery·amqp
开源能源管理系统19 分钟前
MyEMS开源能源管理系统:赋能平板玻璃行业绿色低碳生产
大数据·开源·能源·能源管理系统·平板玻璃
萤丰信息20 分钟前
科技赋能智慧园区:解码绿色转型的“数字密码”
java·大数据·人工智能·科技·安全·智慧城市·智慧园区
培培说证21 分钟前
大专大数据技术专业零基础能考的证书有哪些?
大数据