flink中的重启策略

背景

在flink宣布作业失败的时候往往会进行重试,本文就来记录下flink中的几种重启策略

flink失败重启策略

1.固定延时重启 这种重启策略会重启固定的次数,每两次重启之间会间隔固定的时间间隔,如果失败次数达到了配置的次数限制,那么才宣布作业失败

2.故障率重启策略 这种重启策略会指定在某个时间间隔范围内,容许的最大重启次数限制,并且每两次重启之间也会间隔固定的时间间隔

3.不重启,这种策略是不开启checkpoint机制时的默认重启策略,也就是作业失败就失败了,不会重启

此外,重启也会根据重启的Task范围进行区分

1.Full重启策略,也就是重启时会把这个job的所有task都重启,这种策略是默认的重启策略,也是最简单的实现方式

2.Region重启策略,这种重启策略时只会把受故障影响的task对应的那些容器重启掉,比如只是某一条pineline下的task对应的容器重启,这种实现对于flink来说复杂一些

参考文献:https://nightlies.apache.org/flink/flink-docs-release-1.13/zh/docs/dev/execution/task_failure_recovery/

相关推荐
陆水A9 分钟前
【实时数仓·3】Flink多表JOIN状态爆炸——Event Time Temporal JOIN + TTL分层治理
大数据·数据仓库·数据分析·flink·数据库开发·bigdata
INGNIGHT13 分钟前
Flink 的三种一致性语义
大数据·flink·linq
湘美书院--湘美谈教育29 分钟前
湘美谈教育AI经验集锦:有些东西,它们很难蒸馏
大数据·人工智能·深度学习·机器学习
xiaofj10030 分钟前
reglock工作机制
大数据·安全
xixixi777771 小时前
空天地通信、高速光模块、AI 智能体攻击、同态加密芯片四大事件解读:AI 算力底座攻防与全域通信同步升级
大数据·人工智能·深度学习·ai·大模型·光模块·智能体
数据皮皮侠1 小时前
全国消协智慧 315 平台投诉信息数据库
大数据·人工智能·算法·百度·制造
2601_959481921 小时前
CPT Markets:把平台稳定性做到位——视角梳理与提示整理
大数据
ihuyigui1 小时前
国际商超零售短信接口
大数据·前端·后端·架构·零售
湘美书院--湘美谈教育1 小时前
湘美谈教育AI经验集锦:细分领域的标准定义者
大数据·人工智能·深度学习
SelectDB1 小时前
Agentic Analytics 时代,AI Agent 真正需要怎样的数据基座?
大数据·agent·自动化运维