flink中checkpoint的重启策略

在Apache Flink中，检查点（Checkpoint） 是保障流处理任务容错性的核心机制，而重启策略（Restart Strategy） 则定义了任务失败后的恢复行为。二者协同工作，确保作业的持续性和状态一致性。以下是重启策略的常见类型及配置方法：

那为什么开启检查点之后，报错了程序还在运行？因为开启检查点之后，程序会进行自动重启（无限重启【程序错了才重启】）。

固定间隔策略（Fixed Delay Restart Strategy）

在失败后以固定时间间隔重试，直至达到最大尝试次数。
参数：
- restart-strategy.fixed-delay.attempts: 最大重启尝试次数（例如 3）
- restart-strategy.fixed-delay.delay: 重启间隔（例如 10s）
配置示例：
复制代码
```
env.setRestartStrategy(
    RestartStrategies.fixedDelayRestart(3, Time.seconds(10))
);
```
失败率策略（Failure Rate Restart Strategy）

在指定时间窗口内，若失败次数超过阈值则停止重启。
参数：
- restart-strategy.failure-rate.max-failures-per-interval: 时间窗口内允许的最大失败次数（例如 5）
- restart-strategy.failure-rate.failure-rate-interval: 时间窗口长度（例如 5min）
- restart-strategy.failure-rate.delay: 失败后的重启间隔（例如 10s）
配置示例：
复制代码
```
env.setRestartStrategy(
    RestartStrategies.failureRateRestart(
        5, Time.minutes(5), Time.seconds(10)
    )
);
```
不重启策略（No Restart Strategy）

任务失败后直接停止，不尝试重启。
配置示例：
复制代码
```
env.setRestartStrategy(RestartStrategies.noRestart());
```

全局配置 ：可在 flink-conf.yaml 中设置默认策略，例如：

复制代码

restart-strategy: fixed-delay
restart-strategy.fixed-delay.attempts: 5
restart-strategy.fixed-delay.delay: 15s

选择合适的重启策略需结合业务需求：

通过合理配置检查点与重启策略，可显著提升Flink作业的健壮性。