flink checkpoint barrier对齐机制

flink的checkpoint 采用了 Chandy-Lamport 机制,分布式快照

开启checkpoint 需要指定checkpoint的周期和checkpoint的模式

在开启checkpoint后,假如指定了 10秒 一次,ck模式为 exactly once (barrier对其模式)

前10秒的数据流过去之后,此时jobmanager向各个subtask进程发送一个ckeckpoint准备请求,且会从source端往数据流中插入一个barrier标记,每个subtask收到这个barrier后要进行状态的备份。

一个subtask的数据如果只来自于上游的一个subtask,此时遇到barrier后直接备份当前状态,并且向jobmanager发送ack响应。如果一个subtask来自上游多个subtask,因为上有subtask的barrier到达有早有晚,上游最早的barrier到达之后,收到其他上游数据后被缓存到内存中,不会进行处理,直到上游最晚的barrier到达后,这个subtask会进行一次状态备份,并且向jobmanager发送ack响应。简单说就是多个上游任务向同一个下游任务传递分界线时,需要在下游任务执行"barrier对齐"操作,也就是需要等到所有并行分区的barrier都到齐,才可以开始状态的保存。

jobmanager 收到所有的ack响应后。才认为本次checkpoint是完整的,然后给各个subtask发送callBack通知,告诉他们这次checkpoint成功,

当最终的sink端收到了callBack响应后,就会进行commit,比如支持事务的jdbcsink.exactlyOnceSink(),在收到callback后才会进行commit

上述流程就是flink中 barrier对齐的checkpoint算法

相关推荐
阿里云大数据AI技术1 天前
一站式构建 AI 数据处理 Pipeline:DataWorks Notebook + MaxCompute MaxFrame 快速入门指南
大数据·人工智能
阿里云大数据AI技术1 天前
StarRocks + Paimon: 构建 Lakehouse Native 数据引擎
大数据·人工智能
下海fallsea1 天前
韩国零食正在占领俄罗斯
大数据·人工智能
武汉唯众智创1 天前
全国职业院校技能大赛大数据应用开发实训室建设方案
大数据·国赛·大数据应用开发·大数据实训室·全国职业院校技能大赛·大数据应用开发实训室·大数据应用开发实验室
媒体人8881 天前
E-E-A-T²增强框架:AI时代GEO生成式引擎优化的信任破局之道
大数据·人工智能·搜索引擎·生成式引擎优化·geo优化
Albert Edison1 天前
【Git】分支管理
大数据·git·elasticsearch
山峰哥1 天前
SQL优化中的索引策略与Explain分析实战
大数据·汇编·数据库·sql·编辑器
T06205141 天前
【数据集】上市公司研发投入与专利数据-dta+xlsx(2007-2024年)
大数据
B站计算机毕业设计之家1 天前
大数据毕业设计:基于python图书数据分析可视化系统 书籍大屏 爬虫 清洗 可视化 当当网书籍数据分析 Django框架 图书推荐 大数据
大数据·爬虫·python·机器学习·自然语言处理·数据分析·课程设计
向量引擎小橙1 天前
生成式AI与内容产业的“冰与火之歌”:冰火交锋间的未来图景
大数据·人工智能·深度学习·集成学习