【Flink运行时架构】组件构成

在Flink的运行架构中,有两大比较重要的组件:作业管理器(JobManager)和任务管理器(TaskManager)。

Flink的作业提交与任务处理时的系统如下图所示。

其中,客户端并不是处理系统的一部分,只是负责作业提交,在作业提交之后,可选择与JobManager断开连接。接下来,重点介绍一下JobManager和TaskManager在整个过程中所扮演的角色。

JobManager

JobManager是Flink集群中一个任务管理和调度的核心,是控制应用执行的主进程,每一个应用都应该被唯一的JM控制执行。在高可用的场景下,可能会出现多个JM,但是也只有一个正在运行的Leader节点,其余都是备用。JM又包含三个组件:JobMaster、ResourceManager、Dispatcher。

JobMaster

我们把对数据进行处理的操作统称为任务(task),多个任务按照一定的先后顺序连接起来,就构成了作业(job)。而JobMaster是负责处理单独的作业,因此JobMaster和具体的job是一一对应的。

也就是说,多个job是可以运行在一个Flink集群上的,而每一个job则都有一个自己的JobMaster。

JobMaster在接收到客户端提交的应用后,会把作业图转换成一个物理层面的数据流图,也就是执行图,它包含了所有可以并发执行的任务。JobMaster会向资源管理器发出请求,申请执行任务必要的资源,一旦获取了足够资源,就会将执行图分发到真正运行他们的TaskManager上。

ResourceManager

ResourceManager主要负责资源的分配和管理,在Flink集群中只有一个。这里的资源是指TaskManager的任务槽(slot),它包含了机器用来执行计算的一组CPU和内存。每个任务都需要被分配到一个任务槽中执行。

这里的ResourceManager其实是Flink内置的,注意和其他资源管理平台区分开,比如K8S、YARN等。

TaskManager中的任务槽都会向ResourceManager注册的,当ResourceManager没有足够的任务槽时,它可以向资源管理平台发起会话,请求提供启动TaskManager进程的容器。

Dispatcher

Dispatcher主要负责提供一个REST接口,用来与集群进行交互和管理,负责为每一个新提交的作业启动一个新的JobMaser组件,以及启动一个WebUI用于展示和监控作业执行信息。

TaskManager

每个TaskManager都包含了一定数量的任务槽,任务槽是资源调度的最小单位,其数量限制了TaskManager能够并发处理的任务数量。

TaskManager启动之后,会向ResourceManager注册它的任务槽,收到指令后,TaskManager就会将一个或者多个任务槽提供给JobMaster用于分配任务的调用。

相关推荐
王莎莎-MinerU26 分钟前
MinerU 深度技术解析:从架构原理到生产部署的全面指南
css·人工智能·自然语言处理·架构·ocr·个人开发
盘古信息IMS32 分钟前
盘古信息IMS V6 8.0重磅发布:以薪火AI数智平台点燃离散制造数智化引擎
大数据·人工智能·制造
canonical_entropy34 分钟前
Harness Engineering 之外:从非线性动力系统控制理解吸引子引导工程
架构·aigc·ai编程
Jiude42 分钟前
AI 写代码太快之后,团队协作反而更难了
人工智能·架构·github
论文小助手W6851 小时前
【ACM出版,EI检索】2026年人工智能与智慧城市国际学术会议(IC-AISC 2026)
大数据·人工智能·全文检索·智慧城市·交通物流
盖小雅2 小时前
自动化排班如何破解劳动法合规难题:从规则冲突到可追溯的排班表
大数据·运维·机器学习·自动化
Bechamz2 小时前
大数据开发学习Day43
大数据·学习
五度易链-区域产业数字化管理平台3 小时前
大数据驱动智慧招商:五度易链园区数字化解决方案
大数据
心疼你的一切3 小时前
高效内容生产:如何实现规模化创作
大数据·人工智能·ai·ai编程·ai写作