spark-operaotr

1、系统架构

括如下几个组件:

  1. SparkApplication控制器, 该控制器用于创建、更新、删除SparkApplication对象,同时控制器还会监控相应的事件,执行相应的动作;
  2. Submission Runner, 负责调用spark-submit提交Spark作业, 作业提交的流程完全复用Spark on K8s的模式;
  3. Spark Pod Monitor, 监控Spark作业相关Pod的状态,并同步到控制器中;
  4. Mutating Admission Webhook: 可选模块,基于注解来实现Driver/Executor Pod的一些定制化需求;
  5. SparkCtl: 用于和Spark Operator交互的命令行工具

Spark Operator除了实现基本的作业提交外,还支持如下特性:

  • 声明式的作业管理;
  • 支持更新SparkApplication对象后自动重新提交作业;
  • 支持可配置的重启策略;
  • 支持失败重试;
  • 集成prometheus, 可以收集和转发Spark应用级别的度量和Driver/Executor的度量到prometheus中.

2、Spark Operator 是如何管理Spark作业的

控制器的代码主要位于 pkg/controller/sparkappli cation/controller.go 中。

2.1 、提交流程

提交作业的主流程在 submitSparkApplication 方法中。

提交作业的核心逻辑在submission.go这个模块中。

参考

相关推荐
菠菠萝宝3 分钟前
【Java八股文】11-分布式及场景面试篇
java·分布式·面试·k8s·系统·uuid·mq
nangonghen1 小时前
flink operator v1.10部署flink v1.19.2
大数据·flink·flink operator
莳花微语1 小时前
使用MyCAT实现分布式MySQL双主架构
分布式·mysql·架构
power-辰南4 小时前
高并发系统架构设计全链路指南
分布式·系统架构·高并发·springcloud
大数据追光猿10 小时前
Python应用算法之贪心算法理解和实践
大数据·开发语言·人工智能·python·深度学习·算法·贪心算法
roman_日积跬步-终至千里10 小时前
【分布式理论16】分布式调度2:资源划分和调度策略
分布式
人类群星闪耀时11 小时前
物联网与大数据:揭秘万物互联的新纪元
大数据·物联网·struts
快手技术12 小时前
Blaze RangePartitioning 算子Native实现全解析
spark·naive
DC_BLOG15 小时前
Linux-GlusterFS进阶分布式卷
linux·运维·服务器·分布式
点点滴滴的记录16 小时前
分布式之Raft算法
分布式