Flink-间隔联结

  1. 间隔联结只支持事件时间
  2. 间隔联结如果遇到迟到数据,则会关联不上,比如来了一个5秒的数据,它可以关联前2秒的数据,后3秒的数据,就是可以关联3秒到8秒的数据,然后又来了一个6秒的数据,可以关联4秒到9秒的数据,那么3秒的数据,就永远不会被关联到了,就可以删除了,然后又来了一个迟到数据,比如4秒的数据,可以关联2秒到7秒的数据,但是3秒的数据已经被删除了,所以就关联不上了。对于这种情况,解决办法就是,使用回撤流,比如left join,left join可以设置状态过期时间,这个时间是系统时间,比如我们设置过期时间是5分钟,那么A流的3秒的数据,可以和B流的4秒(迟到数据)的数据关联上,就解决了这个问题。
相关推荐
Robot2513 小时前
「华为」人形机器人赛道投资首秀!
大数据·人工智能·科技·microsoft·华为·机器人
CONTONUE9 小时前
运行Spark程序-在Idea中(二)
大数据·spark·intellij-idea
计算机人哪有不疯的9 小时前
图文展示HDFS、YARN、MapReduce三者关系
大数据·spark
祈53310 小时前
MapReduce 的工作原理
大数据·mapreduce
Agatha方艺璇10 小时前
MapReduce报错 HADOOP_HOME and hadoop.home.dir are unset.
大数据·hadoop·mapreduce
@十八子德月生11 小时前
8天Python从入门到精通【itheima】-1~5
大数据·开发语言·python·学习
元63311 小时前
Hadoop集群的常用命令
大数据·hadoop
武汉格发Gofartlic13 小时前
FEKO许可证的安全与合规性
大数据·运维·安全
姬激薄13 小时前
HDFS概述
大数据·hadoop·hdfs
依年南台13 小时前
克隆虚拟机组成集群
大数据·hadoop