flink checkpoint barrier对齐机制

flink的checkpoint 采用了 Chandy-Lamport 机制,分布式快照

开启checkpoint 需要指定checkpoint的周期和checkpoint的模式

在开启checkpoint后,假如指定了 10秒 一次,ck模式为 exactly once (barrier对其模式)

前10秒的数据流过去之后,此时jobmanager向各个subtask进程发送一个ckeckpoint准备请求,且会从source端往数据流中插入一个barrier标记,每个subtask收到这个barrier后要进行状态的备份。

一个subtask的数据如果只来自于上游的一个subtask,此时遇到barrier后直接备份当前状态,并且向jobmanager发送ack响应。如果一个subtask来自上游多个subtask,因为上有subtask的barrier到达有早有晚,上游最早的barrier到达之后,收到其他上游数据后被缓存到内存中,不会进行处理,直到上游最晚的barrier到达后,这个subtask会进行一次状态备份,并且向jobmanager发送ack响应。简单说就是多个上游任务向同一个下游任务传递分界线时,需要在下游任务执行"barrier对齐"操作,也就是需要等到所有并行分区的barrier都到齐,才可以开始状态的保存。

jobmanager 收到所有的ack响应后。才认为本次checkpoint是完整的,然后给各个subtask发送callBack通知,告诉他们这次checkpoint成功,

当最终的sink端收到了callBack响应后,就会进行commit,比如支持事务的jdbcsink.exactlyOnceSink(),在收到callback后才会进行commit

上述流程就是flink中 barrier对齐的checkpoint算法

相关推荐
廋到被风吹走29 分钟前
DDD领域驱动设计深度解析:从理论到代码实践
java·大数据·linux
说私域35 分钟前
以非常6+1体系为支撑 融入AI智能名片商城小程序 提升组织建设效能
大数据·人工智能·小程序·流量运营·私域运营
数琨创享TQMS质量数智化1 小时前
数琨创享:以数智化质量目标管理闭环赋能可量化、可追溯、可驱动的质量运营
大数据·人工智能·qms质量管理系统
我只会写Bug啊1 小时前
【软考】系统架构设计师-论文范文(六)
大数据·系统架构·信息系统项目管理师·架构设计·系统分析师
是做服装的同学2 小时前
服装企业管理信息系统是什么?它的核心功能和市场优势有哪些?
大数据·经验分享·其他
JZC_xiaozhong2 小时前
KPaaS等平台化数据治理方案如何确保数据一致性?
大数据·etl工程师·数据孤岛解决方案·数据集成与应用集成·异构系统集成
福客AI智能客服2 小时前
AI客服翻车事件背后:电商智能化的关键在于可控
大数据·人工智能
geneculture2 小时前
两大类形式化方略(2013年《计算机应用与软件》+2026第三方评论)
大数据
ZBLHai3 小时前
三款实用投标辅助工具网站推荐
大数据·人工智能
longxibo3 小时前
【Ubuntu datasophon1.2.1 二开之六:解决CLICKHOUSE安装问题】
大数据·linux·clickhouse·ubuntu