flink checkpoint barrier对齐机制

flink的checkpoint 采用了 Chandy-Lamport 机制,分布式快照

开启checkpoint 需要指定checkpoint的周期和checkpoint的模式

在开启checkpoint后,假如指定了 10秒 一次,ck模式为 exactly once (barrier对其模式)

前10秒的数据流过去之后,此时jobmanager向各个subtask进程发送一个ckeckpoint准备请求,且会从source端往数据流中插入一个barrier标记,每个subtask收到这个barrier后要进行状态的备份。

一个subtask的数据如果只来自于上游的一个subtask,此时遇到barrier后直接备份当前状态,并且向jobmanager发送ack响应。如果一个subtask来自上游多个subtask,因为上有subtask的barrier到达有早有晚,上游最早的barrier到达之后,收到其他上游数据后被缓存到内存中,不会进行处理,直到上游最晚的barrier到达后,这个subtask会进行一次状态备份,并且向jobmanager发送ack响应。简单说就是多个上游任务向同一个下游任务传递分界线时,需要在下游任务执行"barrier对齐"操作,也就是需要等到所有并行分区的barrier都到齐,才可以开始状态的保存。

jobmanager 收到所有的ack响应后。才认为本次checkpoint是完整的,然后给各个subtask发送callBack通知,告诉他们这次checkpoint成功,

当最终的sink端收到了callBack响应后,就会进行commit,比如支持事务的jdbcsink.exactlyOnceSink(),在收到callback后才会进行commit

上述流程就是flink中 barrier对齐的checkpoint算法

相关推荐
言午说数据几秒前
数仓入门篇-数仓分层
大数据·面试
IPHWT 零软网络9 分钟前
让前厅更高效,让服务更暖心——HWT2.0酒店话务台,重构宾客体验新范式
大数据·重构
源码技术栈17 分钟前
整合物联网、大数据、人工智能等技术的Java智慧工地项目管理系统源码
大数据·人工智能·物联网·源码·二次开发·项目·智慧工地
掘根25 分钟前
【即时通讯系统】环境搭建4——Elasticsearch(ES)
大数据·elasticsearch·搜索引擎
forAllforMe29 分钟前
IEC 60601 医疗电气设备安全标准解读
大数据·人工智能
2601_9492210338 分钟前
2026年金融AI投研工具对比测评:五大平台深度解析
大数据·人工智能·金融
光锥智能1 小时前
无界动力与生数科技达成战略合作,将在算法、数据与系统方面深度融合
大数据·人工智能·科技
龙亘川1 小时前
AI 时代数据治理的破局与重构:2025 白皮书核心洞察解析
大数据·人工智能·ai 时代数据治理白皮书
liu-yonggang1 小时前
ROS2 性能优化与功能增强方案
大数据·算法·性能优化
好运yoo1 小时前
git fetch和git pull的区别
大数据·git·elasticsearch