Flink快照保留多久、多少个,设置参数

我给你最完整、最准确、面试 + 生产都能用的版本,直接复制即可。


一、核心结论(先记这 3 个参数)

Flink 控制 快照保留多少个、保留多久,就靠这 3 个配置:

  1. 保留最近多少个 Checkpoint
  2. Checkpoint 保留时间(超时时间)
  3. 取消任务时是否删除快照

二、具体参数(代码版 + yaml 版)

1. 保留最近 N 个 Checkpoint(最常用)

默认:只保留 1 个 生产建议:保留 2~3 个

代码设置

java

运行

复制代码
// 保留最近 3 个 Checkpoint
checkpointConfig.setMaxNumberOfRetainedCheckpoints(3);

yaml 设置

yaml

复制代码
execution.checkpointing.num-retained: 3

2. Checkpoint 保留时长(超时时间)

超过这个时间没用,自动删除

代码设置

java

运行

复制代码
// 保留 24 小时(单位毫秒)
checkpointConfig.setCheckpointRetention(24 * 60 * 60 * 1000);

yaml

yaml

复制代码
execution.checkpointing.timeout: 3600000

3. 任务取消 / 失败时,是否保留 Checkpoint

代码

java

运行

复制代码
// 取消任务时保留 Checkpoint(生产必开)
config.setExternalizedCheckpointCleanup(
    CheckpointConfig.ExternalizedCheckpointCleanup.RETAIN_ON_CANCELLATION
);

yaml

yaml

复制代码
execution.checkpointing.externalized-checkpoint-retention: RETAIN_ON_CANCELLATION

三、完整生产推荐配置(直接用)

yaml 完整版

yaml

复制代码
# 每 30s 做一次 CK
execution.checkpointing.interval: 30000

# 最多同时进行 1 个 CK
execution.checkpointing.max-concurrent-checkpoints: 1

# 保留最近 3 个快照
execution.checkpointing.num-retained: 3

# 取消任务时保留 CK
execution.checkpointing.externalized-checkpoint-retention: RETAIN_ON_CANCELLATION

# CK 超时时间 10 分钟
execution.checkpointing.timeout: 600000

代码完整版

java

运行

复制代码
StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();

// 30s 一次 CK
env.enableCheckpointing(30000);

CheckpointConfig config = env.getCheckpointConfig();

// 最多保留 3 个
config.setMaxNumberOfRetainedCheckpoints(3);

// 取消任务保留
config.setExternalizedCheckpointCleanup(RETAIN_ON_CANCELLATION);

// 异步快照
config.setAsyncSnapshot(true);

四、最关键的规则(面试必问)

  1. 保留数量优先 超过 num-retained:3自动删除最旧的
  2. 保留时间次之超过保留时间 → 自动删除
  3. 取消任务是否保留
    • RETAIN_ON_CANCELLATION 保留
    • DELETE_ON_CANCELLATION 删除

五、一句话背诵版(面试满分)

Flink 通过 execution.checkpointing.num-retained 设置保留最近多少个 Checkpoint,通过 timeout 设置保留时长,通过 externalized-checkpoint-retention 控制取消任务时是否保留;默认只保留 1 个,生产建议保留 2-3 个,防止快照损坏无法恢复。

相关推荐
大大大大晴天7 小时前
Flinksql内置函数不够用?一文弄懂UDF
flink
大大大大晴天2 天前
Hudi Metadata Table 与 Hive Sync (HMS)怎么选?
大数据
手可摘星辰7772 天前
一次线上FlinkCDC异常排查复盘
大数据·flink
大大大大晴天2 天前
Hudi技术内幕:Metadata Table原理与实践
大数据
大大大大晴天3 天前
Hudi技术内幕:深入解析Index索引机制
大数据
阿里云大数据AI技术3 天前
Flink Forward Asia 2026 深圳启幕:Agentic Streaming for AI,开启实时智能新范式
大数据·flink
SelectDB4 天前
阶跃星辰基于 SelectDB 构建 PB 级 Agent 可观测平台
大数据·数据库·aigc
tonyabasy5 天前
Flink 实时数仓开发实战:SQL中也能做到资源精细化管理
flink
大大大大晴天5 天前
浅聊Flink实时关联计算的不适用场景
flink
大大大大晴天6 天前
深入解析 Flink Kafka Connector:原理、配置与最佳实践
flink