Flink快照保留多久、多少个,设置参数

我给你最完整、最准确、面试 + 生产都能用的版本,直接复制即可。


一、核心结论(先记这 3 个参数)

Flink 控制 快照保留多少个、保留多久,就靠这 3 个配置:

  1. 保留最近多少个 Checkpoint
  2. Checkpoint 保留时间(超时时间)
  3. 取消任务时是否删除快照

二、具体参数(代码版 + yaml 版)

1. 保留最近 N 个 Checkpoint(最常用)

默认:只保留 1 个 生产建议:保留 2~3 个

代码设置

java

运行

复制代码
// 保留最近 3 个 Checkpoint
checkpointConfig.setMaxNumberOfRetainedCheckpoints(3);

yaml 设置

yaml

复制代码
execution.checkpointing.num-retained: 3

2. Checkpoint 保留时长(超时时间)

超过这个时间没用,自动删除

代码设置

java

运行

复制代码
// 保留 24 小时(单位毫秒)
checkpointConfig.setCheckpointRetention(24 * 60 * 60 * 1000);

yaml

yaml

复制代码
execution.checkpointing.timeout: 3600000

3. 任务取消 / 失败时,是否保留 Checkpoint

代码

java

运行

复制代码
// 取消任务时保留 Checkpoint(生产必开)
config.setExternalizedCheckpointCleanup(
    CheckpointConfig.ExternalizedCheckpointCleanup.RETAIN_ON_CANCELLATION
);

yaml

yaml

复制代码
execution.checkpointing.externalized-checkpoint-retention: RETAIN_ON_CANCELLATION

三、完整生产推荐配置(直接用)

yaml 完整版

yaml

复制代码
# 每 30s 做一次 CK
execution.checkpointing.interval: 30000

# 最多同时进行 1 个 CK
execution.checkpointing.max-concurrent-checkpoints: 1

# 保留最近 3 个快照
execution.checkpointing.num-retained: 3

# 取消任务时保留 CK
execution.checkpointing.externalized-checkpoint-retention: RETAIN_ON_CANCELLATION

# CK 超时时间 10 分钟
execution.checkpointing.timeout: 600000

代码完整版

java

运行

复制代码
StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();

// 30s 一次 CK
env.enableCheckpointing(30000);

CheckpointConfig config = env.getCheckpointConfig();

// 最多保留 3 个
config.setMaxNumberOfRetainedCheckpoints(3);

// 取消任务保留
config.setExternalizedCheckpointCleanup(RETAIN_ON_CANCELLATION);

// 异步快照
config.setAsyncSnapshot(true);

四、最关键的规则(面试必问)

  1. 保留数量优先 超过 num-retained:3自动删除最旧的
  2. 保留时间次之超过保留时间 → 自动删除
  3. 取消任务是否保留
    • RETAIN_ON_CANCELLATION 保留
    • DELETE_ON_CANCELLATION 删除

五、一句话背诵版(面试满分)

Flink 通过 execution.checkpointing.num-retained 设置保留最近多少个 Checkpoint,通过 timeout 设置保留时长,通过 externalized-checkpoint-retention 控制取消任务时是否保留;默认只保留 1 个,生产建议保留 2-3 个,防止快照损坏无法恢复。

相关推荐
qziovv17 小时前
Git 回退场景
大数据·git·elasticsearch
清平乐的技术专栏18 小时前
【Flink学习】(五)Flink 并行度与任务链,任务运行核心原理
flink
ZeroNews内网穿透19 小时前
面向 AI 协作的本地客户端能力:ZeroNews Agent Skills
大数据·人工智能·elasticsearch
SelectDB19 小时前
Agent 时代,为什么传统的可观测方案不适用了?
大数据·数据库·数据分析
Elastic 中国社区官方博客19 小时前
快 12 倍的 Elasticsearch 向量索引:使用 GPU 和 CPU 分层部署 NVIDIA cuVS
大数据·人工智能·elasticsearch·搜索引擎·ai·全文检索·nvidia
鹧鸪云光伏19 小时前
光伏设计软件:多屋脊房型如何设计?
大数据·信息可视化·光伏·光伏设计·光伏图纸
前沿推行者19 小时前
辽宁传媒学院教学特色解析:从实践导向到产教融合
大数据·人工智能
数智化管理手记20 小时前
精益生产3步实操,让现场从混乱变标杆
大数据·运维·网络·人工智能·精益工程
多年小白20 小时前
2026年5月半导体板块深度分析
大数据·人工智能·科技·区块链
才兄说20 小时前
机器人二次开发机器人动作定制?毫秒级同步精度
大数据·人工智能·机器人