Flink checkpoint问题排查指南

之前只因为checkpoint过大碰到过checkpoint失败的情况,没想到数据倾斜也会导致

我们知道 task 仅在接受到所有的 barrier 之后才会进行 snapshot,如果作业存在反压,或者有数据倾斜,则会导致全部的 channel 或者某些 channel 的 barrier 发送慢,从而整体影响 Checkpoint 的时间,这两个可以通过如下的页面进行检查:

Apache Flink学习网

相关推荐
青云交1 小时前
Java 大视界 -- Java+Flink CDC 构建实时数据同步系统:从 MySQL 到 Hive 全增量同步(443)
java·mysql·flink·实时数据同步·java+flink cdc·mysql→hive·全增量同步
Jackeyzhe13 小时前
Flink源码阅读:Task数据交互
flink
面向Google编程13 小时前
Flink源码阅读:Netty通信
大数据·flink
金刚猿19 小时前
工作流调度平台 Dolphinscheduler - Standalone 单机部署 + Flink 部署【kafka消息推送、flink 消费】
大数据·flink
杂家1 天前
Hudi集成Flink
大数据·flink·eclipse
CappuccinoRose2 天前
流计算概述
python·flink·流计算·数据流·pyflink
yumgpkpm2 天前
AI评判:信创替代对Cloudera CDH CDP Hadoop大数据平台有何影响?
大数据·hive·oracle·flink·kafka·hbase·cloudera
Hello.Reader2 天前
PyFlink 向量化 UDF(Vectorized UDF)Arrow 批传输原理、pandas 标量/聚合函数、配置与内存陷阱、五种写法一网打尽
python·flink·pandas
虫小宝2 天前
导购电商平台用户行为分析系统:基于Flink的实时数据处理架构
大数据·架构·flink
驾数者2 天前
Flink SQL格式集成:JSON、Avro、Protobuf序列化详解
sql·flink·json