Flink Rebalance触发乱序的问题

前言

Flink中的Rebalance是一种分区算子,主要用于实现数据流的负载均衡。其核心机制是通过Round-Robin轮询策略将输入数据均匀分配到下游算子的所有并行任务中。

遇到的问题

发现上游kafka source中数据相差几毫秒的数据,在通过计算,最终下发到sink出现于实际业务不能对齐的问题。

排查问题

发现近期加了一个filter算子,用于过滤不必要的数据,但他的算子链接方式为rebalance

解决问题

将算的连接方式改为hash,根据唯一键keyby,解决问题。

相关推荐
xerthwis17 分钟前
Hadoop:大数据世界的“古老基石”与“沉默的共生者”
大数据·人工智能·hadoop
武子康1 小时前
大数据-192 DataX 3.0 架构与实战:Reader/Writer 插件模型、Job/TaskGroup 调度、speed/errorLimit 配置速
大数据·分布式·后端
kdniao11 小时前
小程序和电商商家物流查询监控解决方案
大数据·小程序
Hello.Reader1 小时前
Flink Materialized Table 完整部署与运维指南:架构、SQL Gateway、Catalog Store、调度刷新一站式落地
运维·架构·flink
山沐与山1 小时前
【Flink】Flink数据源Source详解
大数据·flink
PS1232322 小时前
隔爆型防爆压力变送器的多信号输出优势
大数据·人工智能
Jackyzhe2 小时前
Flink源码阅读:Watermark机制
大数据·flink
TG:@yunlaoda360 云老大2 小时前
如何通过华为云国际站代理商CSBS进行跨Region备份与容灾?
大数据·数据库·华为云
Hello.Reader2 小时前
Flink Materialized Table Quickstart本地 10 分钟跑通 CONTINUOUS / FULL
大数据·flink
DolphinDB智臾科技2 小时前
如何用脚本榨出C++级性能?微秒级低延时系统优化深度解析
大数据·c++·时序数据库·低延时·dolphindb