Flink的CheckPoint与SavePoint

Flink的Checkpoint(检查点)和Savepoint(保存点)是两种不同的状态快照机制,主要区别如下:

1. ‌Checkpoint

  • 核心功能‌:周期性触发的容错机制,用于故障恢复时保证状态一致性57。
  • 触发方式‌:由JobManager周期性触发,通过Barrier机制实现分布式快照26。
  • 存储内容‌:保存所有算子的状态快照,支持Exactly-Once语义15。
  • 生命周期‌:自动管理,旧检查点会被清理以释放存储空间7。
  • 性能影响‌:高频检查点可能增加系统开销,需平衡间隔时间与恢复速度7。

2. ‌Savepoint

  • 核心功能‌:手动触发的全局状态快照,用于有计划的状态迁移或版本升级5。
  • 触发方式‌:通过命令行或API显式触发,生成完整应用状态副本5。
  • 存储内容‌:包含检查点数据及作业拓扑信息,支持跨集群或配置恢复5。
  • 生命周期‌:需手动维护,长期保留需额外存储成本5。
  • 用途扩展‌:支持作业暂停后从相同状态恢复,或Flink版本升级时的兼容性测试5。

3. ‌关键差异

特性 Checkpoint Savepoint
触发方式 自动周期性触发27 手动触发5
存储目标 故障恢复(短期)7 运维操作(长期)5
数据包含 仅状态快照1 状态+作业拓扑5
性能优化 增量快照(RocksDB支持)3 全量快照5

4. ‌技术实现

  • Checkpoint‌:基于Chandy-Lamport算法,通过Barrier对齐实现一致性快照26。
  • Savepoint‌:依赖Checkpoint机制生成,但需额外序列化作业元数据5。

两者共同构成Flink的容错与运维能力,Checkpoint保障实时可靠性,Savepoint提供灵活性运维支持

相关推荐
焦耳热科技前沿16 分钟前
北京科技大学/理化所ACS Nano:混合价态Cu₂Sb金属间化合物实现高效尿素电合成
大数据·人工智能·自动化·能源·材料工程
min1811234561 小时前
深度伪造内容的检测与溯源技术
大数据·网络·人工智能
武子康1 小时前
大数据-209 深度理解逻辑回归(Logistic Regression)与梯度下降优化算法
大数据·后端·机器学习
数据智研2 小时前
【数据分享】(2005–2016年)基于水资源承载力的华北地区降水与地下水要素数据
大数据·人工智能·信息可视化·数据分析
TDengine (老段)3 小时前
TDengine Python 连接器入门指南
大数据·数据库·python·物联网·时序数据库·tdengine·涛思数据
亚古数据4 小时前
亚古数据:查询斯里兰卡公司可以获取什么文件和信息?
大数据·亚古数据·斯里兰卡公司查询
WLJT1231231234 小时前
守护自然与滋养民生的绿色之路
大数据·安全
min1811234564 小时前
PC端零基础跨职能流程图制作教程
大数据·人工智能·信息可视化·架构·流程图
静听松涛1334 小时前
中文PC端多人协作泳道图制作平台
大数据·论文阅读·人工智能·搜索引擎·架构·流程图·软件工程
黄焖鸡能干四碗5 小时前
智能制造工业大数据应用及探索方案(PPT文件)
大数据·运维·人工智能·制造·需求分析