Flink Rebalance触发乱序的问题

前言

Flink中的Rebalance是一种分区算子,主要用于实现数据流的负载均衡。其核心机制是通过Round-Robin轮询策略将输入数据均匀分配到下游算子的所有并行任务中。

遇到的问题

发现上游kafka source中数据相差几毫秒的数据,在通过计算,最终下发到sink出现于实际业务不能对齐的问题。

排查问题

发现近期加了一个filter算子,用于过滤不必要的数据,但他的算子链接方式为rebalance

解决问题

将算的连接方式改为hash,根据唯一键keyby,解决问题。

相关推荐
百***07457 分钟前
OpenClaw+一步API实战:本地化AI自动化助手从部署到落地全指南
大数据·人工智能·python
好好沉淀8 分钟前
Elasticsearch 中批量更新文档(Update By Query)的标准写法
大数据·elasticsearch
BYSJMG9 分钟前
计算机毕设选题推荐:基于Hadoop的交通事故数据可视化分析系统
大数据·vue.js·hadoop·分布式·后端·信息可视化·课程设计
小程故事多_8016 分钟前
Elasticsearch ES 分词与关键词匹配技术方案解析
大数据·人工智能·elasticsearch·搜索引擎·aigc
念丶小宇17 分钟前
Git常用指令
大数据·git·elasticsearch
IT研究所1 小时前
信创浪潮下 ITSM 的价值重构与实践赋能
大数据·运维·人工智能·安全·低代码·重构·自动化
AI职业加油站1 小时前
Python技术应用工程师:互联网行业技能赋能者
大数据·开发语言·人工智能·python·数据分析
深蓝海域知识库1 小时前
深蓝海域中标大型机电企业大模型知识工程平台项目
大数据·人工智能
Gain_chance1 小时前
32-学习笔记尚硅谷数仓搭建-DWD层首日数据装载脚本及每日数据装载脚本
大数据·数据仓库·hive·笔记·学习
sheji34161 小时前
【开题答辩全过程】以 基于hadoop的空气质量数据分析及可视化系统为例,包含答辩的问题和答案
大数据·hadoop·数据分析