Flink Rebalance触发乱序的问题

前言

Flink中的Rebalance是一种分区算子,主要用于实现数据流的负载均衡。其核心机制是通过Round-Robin轮询策略将输入数据均匀分配到下游算子的所有并行任务中。

遇到的问题

发现上游kafka source中数据相差几毫秒的数据,在通过计算,最终下发到sink出现于实际业务不能对齐的问题。

排查问题

发现近期加了一个filter算子,用于过滤不必要的数据,但他的算子链接方式为rebalance

解决问题

将算的连接方式改为hash,根据唯一键keyby,解决问题。

相关推荐
GIS数据转换器1 天前
GIS+大模型助力安全风险精细化管理
大数据·网络·人工智能·安全·无人机
hg01181 天前
今年前10个月天津进出口总值6940.2亿元
大数据
byte轻骑兵1 天前
时序数据库选型指南:从大数据视角看IoTDB的核心优势
大数据·时序数据库·iotdb
Leo.yuan1 天前
制造业都在说BOM,为什么BOM这么重要?
大数据·bom·企业数字化·数字赋能
能鈺CMS1 天前
内容付费系统全面解析:构建知识变现体系的最强工具(2025 SEO 深度专题)
大数据·人工智能·html
原神启动11 天前
云计算大数据——Nginx 实战系列(性能优化与防盗链配置)
大数据·nginx·云计算
周全全1 天前
基于ElasticSearch的语义检索学习-向量化数据、向量化相似度、向量化检索
大数据·学习·elasticsearch
可涵不会debug1 天前
时序数据库选型指南:大数据时代下Apache IoTDB的崛起之路
大数据·apache·时序数据库
WLJT1231231231 天前
藏在细节里的生活答案
大数据·生活
TDengine (老段)1 天前
TDengine 日期函数 DATE 用户手册
大数据·数据库·物联网·时序数据库·iot·tdengine·涛思数据