2.3 Spark运行架构与流程

Spark运行架构与流程包括几个核心概念:Driver负责提交应用并初始化作业,Executor在工作节点上执行任务,作业是一系列计算任务,任务是作业的基本执行单元,阶段是一组并行任务。Spark支持多种运行模式,包括单机、Standalone集群、YARN和Mesos集群,以及高可用集群。运行流程包括资源申请、分配、反馈、反向注册和任务提交。Driver与Cluster Manager通信,管理资源和任务,Executor向Driver注册并执行任务。整个流程确保了Spark应用的高效执行和资源的合理利用。

相关推荐
迷人的小荔枝3 小时前
spark-core
spark
BenBen尔5 小时前
spark的堆外内存,是在jvm内还是操作系统内存内?
大数据·jvm·hadoop·spark
孟意昶13 小时前
大数据面试问答-Spark
大数据·面试·spark
早睡33515 小时前
spark-SOL简介
大数据·分布式·spark
企鹅不耐热.15 小时前
Spark-SQL
大数据·分布式·spark
煤烦恼15 小时前
Spark-SQL核心编程(一)
大数据·sql·spark
阿里云大数据AI技术16 小时前
鹰角:EMR Serverless Spark 在《明日方舟》游戏业务的应用
大数据·spark·serverless
不要天天开心1 天前
Spark Core编程核心要点总结
机器学习·spark
早睡3351 天前
大数据技术之SPARK
大数据·分布式·spark
企鹅不耐热.1 天前
Spark-Core编程
大数据·分布式·spark