Flink快照保留多久、多少个,设置参数

我给你最完整、最准确、面试 + 生产都能用的版本,直接复制即可。


一、核心结论(先记这 3 个参数)

Flink 控制 快照保留多少个、保留多久,就靠这 3 个配置:

  1. 保留最近多少个 Checkpoint
  2. Checkpoint 保留时间(超时时间)
  3. 取消任务时是否删除快照

二、具体参数(代码版 + yaml 版)

1. 保留最近 N 个 Checkpoint(最常用)

默认:只保留 1 个 生产建议:保留 2~3 个

代码设置

java

运行

复制代码
// 保留最近 3 个 Checkpoint
checkpointConfig.setMaxNumberOfRetainedCheckpoints(3);

yaml 设置

yaml

复制代码
execution.checkpointing.num-retained: 3

2. Checkpoint 保留时长(超时时间)

超过这个时间没用,自动删除

代码设置

java

运行

复制代码
// 保留 24 小时(单位毫秒)
checkpointConfig.setCheckpointRetention(24 * 60 * 60 * 1000);

yaml

yaml

复制代码
execution.checkpointing.timeout: 3600000

3. 任务取消 / 失败时,是否保留 Checkpoint

代码

java

运行

复制代码
// 取消任务时保留 Checkpoint(生产必开)
config.setExternalizedCheckpointCleanup(
    CheckpointConfig.ExternalizedCheckpointCleanup.RETAIN_ON_CANCELLATION
);

yaml

yaml

复制代码
execution.checkpointing.externalized-checkpoint-retention: RETAIN_ON_CANCELLATION

三、完整生产推荐配置(直接用)

yaml 完整版

yaml

复制代码
# 每 30s 做一次 CK
execution.checkpointing.interval: 30000

# 最多同时进行 1 个 CK
execution.checkpointing.max-concurrent-checkpoints: 1

# 保留最近 3 个快照
execution.checkpointing.num-retained: 3

# 取消任务时保留 CK
execution.checkpointing.externalized-checkpoint-retention: RETAIN_ON_CANCELLATION

# CK 超时时间 10 分钟
execution.checkpointing.timeout: 600000

代码完整版

java

运行

复制代码
StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();

// 30s 一次 CK
env.enableCheckpointing(30000);

CheckpointConfig config = env.getCheckpointConfig();

// 最多保留 3 个
config.setMaxNumberOfRetainedCheckpoints(3);

// 取消任务保留
config.setExternalizedCheckpointCleanup(RETAIN_ON_CANCELLATION);

// 异步快照
config.setAsyncSnapshot(true);

四、最关键的规则(面试必问)

  1. 保留数量优先 超过 num-retained:3自动删除最旧的
  2. 保留时间次之超过保留时间 → 自动删除
  3. 取消任务是否保留
    • RETAIN_ON_CANCELLATION 保留
    • DELETE_ON_CANCELLATION 删除

五、一句话背诵版(面试满分)

Flink 通过 execution.checkpointing.num-retained 设置保留最近多少个 Checkpoint,通过 timeout 设置保留时长,通过 externalized-checkpoint-retention 控制取消任务时是否保留;默认只保留 1 个,生产建议保留 2-3 个,防止快照损坏无法恢复。

相关推荐
看海的四叔3 小时前
【SQL】SQL-管好你的字符串
大数据·数据库·hive·sql·数据分析·字符串
坚持就完事了3 小时前
YARN资源管理器
大数据·linux·hadoop·学习
Mr数据杨3 小时前
飞船乘客状态预测与金融风控建模启发
大数据·机器学习·数据分析·kaggle
金融小师妹3 小时前
AI治理框架下的货币政策接续:鲍威尔理事留任机制与决策权迁移的系统博弈
大数据·人工智能·逻辑回归·能源
Fullde福德负载箱厂家3 小时前
负载箱的隐性成本与全周期经济性:用户应知的持有成本与价值管理
大数据·安全·制造
程序鉴定师3 小时前
深圳小程序制作哪家好?2026深度市场分析与选择指南?
大数据·小程序
逸Y 仙X4 小时前
文章十六:ElasticSearch 使用enrich策略实现大宽表
java·大数据·数据库·elasticsearch·搜索引擎·全文检索
jkyy20144 小时前
AI赋能智慧座舱:健康有益重构移动健康空间,定义出行健康新范式
大数据·人工智能·物联网·健康医疗
阿明观察4 小时前
破局·领航·赋能:解码国家云如何开辟Token经济新路径
大数据·人工智能