- 间隔联结只支持事件时间
- 间隔联结如果遇到迟到数据,则会关联不上,比如来了一个5秒的数据,它可以关联前2秒的数据,后3秒的数据,就是可以关联3秒到8秒的数据,然后又来了一个6秒的数据,可以关联4秒到9秒的数据,那么3秒的数据,就永远不会被关联到了,就可以删除了,然后又来了一个迟到数据,比如4秒的数据,可以关联2秒到7秒的数据,但是3秒的数据已经被删除了,所以就关联不上了。对于这种情况,解决办法就是,使用回撤流,比如left join,left join可以设置状态过期时间,这个时间是系统时间,比如我们设置过期时间是5分钟,那么A流的3秒的数据,可以和B流的4秒(迟到数据)的数据关联上,就解决了这个问题。
Flink-间隔联结
青云游子2023-08-10 12:51
相关推荐
二二孚日2 小时前
自用华为ICT云赛道Big Data第四章知识点-Flink流批一体分布式实时处理引擎xufwind2 小时前
spark standlone 集群离线安装AI数据皮皮侠3 小时前
中国区域10m空间分辨率楼高数据集(全国/分省/分市/免费数据)DeepSeek大模型官方教程4 小时前
NLP之文本纠错开源大模型:兼看语音大模型总结大数据CLUB5 小时前
基于spark的奥运会奖牌变化数据分析Edingbrugh.南空6 小时前
Hadoop高可用集群搭建智慧化智能化数字化方案6 小时前
69页全面预算管理体系的框架与落地【附全文阅读】武子康6 小时前
大数据-33 HBase 整体架构 HMaster HRegionEdingbrugh.南空8 小时前
Flink ClickHouse 连接器维表源码深度解析诗旸的技术记录与分享20 小时前
Flink-1.19.0源码详解-番外补充3-StreamGraph图