Flink Rebalance触发乱序的问题

前言

Flink中的Rebalance是一种分区算子,主要用于实现数据流的负载均衡。其核心机制是通过Round-Robin轮询策略将输入数据均匀分配到下游算子的所有并行任务中。

遇到的问题

发现上游kafka source中数据相差几毫秒的数据,在通过计算,最终下发到sink出现于实际业务不能对齐的问题。

排查问题

发现近期加了一个filter算子,用于过滤不必要的数据,但他的算子链接方式为rebalance

解决问题

将算的连接方式改为hash,根据唯一键keyby,解决问题。

相关推荐
competes1 分钟前
深圳程序员职业生涯
java·大数据·开发语言·人工智能·java-ee
飓风_数字IC验证12 分钟前
【业务】ISSCC 2026 五大领域核心Session文章梳理
大数据·人工智能
@PHARAOH30 分钟前
WHAT - git worktree 开发的并发模型
大数据·git·elasticsearch
轻造科技30 分钟前
生产异常知识库+案例库:同类问题快速查解决方案,处理时间缩短60%
大数据·人工智能
210Brian2 小时前
嘉立创EDA硬件设计与实战学习笔记(二):元件符号与封装的绘制
大数据·笔记·学习
历程里程碑2 小时前
Proto3 三大高级类型:Any、Oneof、Map 灵活解决复杂业务场景
java·大数据·开发语言·数据结构·elasticsearch·链表·搜索引擎
第二只羽毛2 小时前
IO代码解释3
java·大数据·开发语言
wanhengidc3 小时前
云手机与模拟器的关系
大数据·运维·服务器·分布式·智能手机
网络工程小王3 小时前
【Python数据分析基础】
大数据·数据库·人工智能·学习
方向研究4 小时前
尼龙66生产
大数据