- 间隔联结只支持事件时间
- 间隔联结如果遇到迟到数据,则会关联不上,比如来了一个5秒的数据,它可以关联前2秒的数据,后3秒的数据,就是可以关联3秒到8秒的数据,然后又来了一个6秒的数据,可以关联4秒到9秒的数据,那么3秒的数据,就永远不会被关联到了,就可以删除了,然后又来了一个迟到数据,比如4秒的数据,可以关联2秒到7秒的数据,但是3秒的数据已经被删除了,所以就关联不上了。对于这种情况,解决办法就是,使用回撤流,比如left join,left join可以设置状态过期时间,这个时间是系统时间,比如我们设置过期时间是5分钟,那么A流的3秒的数据,可以和B流的4秒(迟到数据)的数据关联上,就解决了这个问题。
Flink-间隔联结
青云游子2023-08-10 12:51
相关推荐
你觉得2056 小时前
哈尔滨工业大学DeepSeek公开课:探索大模型原理、技术与应用从GPT到DeepSeek|附视频与讲义下载方法啊喜拔牙7 小时前
1. hadoop 集群的常用命令别惊鹊7 小时前
MapReduce工作原理8K超高清7 小时前
中国8K摄像机:科技赋能文化传承新图景2401_871290588 小时前
MapReduce 的工作原理SelectDB技术团队9 小时前
Apache Doris 2025 Roadmap:构建 GenAI 时代实时高效统一的数据底座你觉得2059 小时前
浙江大学朱霖潮研究员:《人工智能重塑科学与工程研究》以蛋白质结构预测为例|附PPT下载方法益莱储中国10 小时前
世界通信大会、嵌入式展及慕尼黑上海光博会亮点回顾Loving_enjoy10 小时前
基于Hadoop的明星社交媒体影响力数据挖掘平台:设计与实现浮尘笔记11 小时前
go-zero使用elasticsearch踩坑记:时间存储和展示问题