- 间隔联结只支持事件时间
- 间隔联结如果遇到迟到数据,则会关联不上,比如来了一个5秒的数据,它可以关联前2秒的数据,后3秒的数据,就是可以关联3秒到8秒的数据,然后又来了一个6秒的数据,可以关联4秒到9秒的数据,那么3秒的数据,就永远不会被关联到了,就可以删除了,然后又来了一个迟到数据,比如4秒的数据,可以关联2秒到7秒的数据,但是3秒的数据已经被删除了,所以就关联不上了。对于这种情况,解决办法就是,使用回撤流,比如left join,left join可以设置状态过期时间,这个时间是系统时间,比如我们设置过期时间是5分钟,那么A流的3秒的数据,可以和B流的4秒(迟到数据)的数据关联上,就解决了这个问题。
Flink-间隔联结
青云游子2023-08-10 12:51
相关推荐
天冬忘忧5 分钟前
Flink优化----数据倾斜李昊哲小课5 分钟前
deepin 安装 zookeeper筒栗子23 分钟前
复习打卡大数据篇——Hadoop MapReduce金州饿霸27 分钟前
Hadoop集群(HDFS集群、YARN集群、MapReduce计算框架)lucky_syq1 小时前
Spark和MapReduce之间的区别?LonelyProgramme1 小时前
Flink定时器m0_748244832 小时前
StarRocks 排查单副本表NiNg_1_2342 小时前
Hadoop中MapReduce过程中Shuffle过程实现自定义排序B站计算机毕业设计超人2 小时前
计算机毕业设计PySpark+Hadoop中国城市交通分析与预测 Python交通预测 Python交通可视化 客流量预测 交通大数据 机器学习 深度学习沛沛老爹2 小时前
什么是 DevOps 自动化?