Spark详解

原理架构图

核心概念

  1. Driver: 一个应用只有一个Driver单节点 ,有任务队列,单线程串行执行 提交任务。但是一个集群可以有多个应用,实现应用级别的并发。向cluster Mannager申请执行节点资源,划分任务Stage,并整合worker结果
  2. Cluster Mannager: 资源管理器,接受Driver请求,按需启动Worker节点,不同模式启动时机不同。
  3. Worker: Worker启动后,注册给Driver,并接受执行Driver分发的任务,结果返回Driver,worker之间并行执行

Worker启动时机

收Cluster Mannager模式控制

  1. Standalone模式: 刚开始Worker就全部启动
  2. YARN模式: 动态按需
  3. K8s模式: 完全动态
相关推荐
短剑重铸之日2 小时前
《7天学会Redis》Day 1 - Redis核心架构与线程模型
java·redis·后端·架构·i/o多路复用·7天学会redis
努力的小郑2 小时前
Spring 的西西弗斯之石:理解 BeanFactory、FactoryBean 与 ObjectFactory
后端·spring·面试
华仔啊2 小时前
Java 异步调用失败导致系统崩溃?这份重试机制救了我
java·后端
SimonKing2 小时前
基于Netty的WebSocket服务端
java·后端·程序员
UpgradeLink2 小时前
基于 Go 打造的升级链路管理平台:upgradelink 让设备升级更简单
开发语言·后端·golang
CodeSheep3 小时前
这个老牌知名编程论坛,彻底倒下了!
前端·后端·程序员
*才华有限公司*3 小时前
#从401到200:Spring Boot + Vue 静态资源访问全链路问题解决方案
vue.js·spring boot·后端
superman超哥3 小时前
Rust 异步并发基石:异步锁(Mutex、RwLock)的设计与深度实践
开发语言·后端·rust·编程语言·rust异步并发·rust异步锁·rust mutex
叫我:松哥3 小时前
基于Flask开发的智能招聘平台,集成了AI匹配引擎、数据预测分析和可视化展示功能
人工智能·后端·python·信息可视化·自然语言处理·flask·推荐算法