flink checkpoint barrier对齐机制

flink的checkpoint 采用了 Chandy-Lamport 机制,分布式快照

开启checkpoint 需要指定checkpoint的周期和checkpoint的模式

在开启checkpoint后,假如指定了 10秒 一次,ck模式为 exactly once (barrier对其模式)

前10秒的数据流过去之后,此时jobmanager向各个subtask进程发送一个ckeckpoint准备请求,且会从source端往数据流中插入一个barrier标记,每个subtask收到这个barrier后要进行状态的备份。

一个subtask的数据如果只来自于上游的一个subtask,此时遇到barrier后直接备份当前状态,并且向jobmanager发送ack响应。如果一个subtask来自上游多个subtask,因为上有subtask的barrier到达有早有晚,上游最早的barrier到达之后,收到其他上游数据后被缓存到内存中,不会进行处理,直到上游最晚的barrier到达后,这个subtask会进行一次状态备份,并且向jobmanager发送ack响应。简单说就是多个上游任务向同一个下游任务传递分界线时,需要在下游任务执行"barrier对齐"操作,也就是需要等到所有并行分区的barrier都到齐,才可以开始状态的保存。

jobmanager 收到所有的ack响应后。才认为本次checkpoint是完整的,然后给各个subtask发送callBack通知,告诉他们这次checkpoint成功,

当最终的sink端收到了callBack响应后,就会进行commit,比如支持事务的jdbcsink.exactlyOnceSink(),在收到callback后才会进行commit

上述流程就是flink中 barrier对齐的checkpoint算法

相关推荐
成长之路5149 分钟前
【实证分析】数据资产信息披露程度数据集-含原始数据及do代码(2007-2024年)
大数据
Elastic 中国社区官方博客22 分钟前
Elasticsearch:在 X-mas 吃一些更健康的东西
android·大数据·数据库·人工智能·elasticsearch·搜索引擎·全文检索
消失的旧时光-194341 分钟前
微服务的本质,其实是操作系统设计思想
java·大数据·微服务
PNP Robotics1 小时前
PNP机器人受邀参加英业达具身智能活动
大数据·人工智能·python·学习·机器人
360智汇云2 小时前
存储压缩:不是“挤水分”,而是让数据“轻装上阵
大数据·人工智能
码农小白猿4 小时前
IACheck优化电梯定期检验报告:自动化术语审核提升合规性与效率
大数据·运维·人工智能·ai·自动化·iacheck
URBBRGROUN4674 小时前
Spring AI @ToolParam 扩展注解改造实践
大数据·人工智能·spring
WZTTMoon4 小时前
Spring Boot OAuth2 授权码模式开发实战
大数据·数据库·spring boot
中科天工5 小时前
智能仓储解决方案到底是什么?
大数据·人工智能·智能
xl-xueling5 小时前
从快手直播故障,看全景式业务监控势在必行!
大数据·后端·网络安全·流式计算