- 间隔联结只支持事件时间
- 间隔联结如果遇到迟到数据,则会关联不上,比如来了一个5秒的数据,它可以关联前2秒的数据,后3秒的数据,就是可以关联3秒到8秒的数据,然后又来了一个6秒的数据,可以关联4秒到9秒的数据,那么3秒的数据,就永远不会被关联到了,就可以删除了,然后又来了一个迟到数据,比如4秒的数据,可以关联2秒到7秒的数据,但是3秒的数据已经被删除了,所以就关联不上了。对于这种情况,解决办法就是,使用回撤流,比如left join,left join可以设置状态过期时间,这个时间是系统时间,比如我们设置过期时间是5分钟,那么A流的3秒的数据,可以和B流的4秒(迟到数据)的数据关联上,就解决了这个问题。
Flink-间隔联结
青云游子2023-08-10 12:51
相关推荐
一只栖枝4 小时前
华为 HCIE 大数据认证中 Linux 命令行的运用及价值喂完待续8 小时前
Apache Hudi:数据湖的实时革命青云交8 小时前
Java 大视界 -- 基于 Java 的大数据可视化在城市交通拥堵治理与出行效率提升中的应用(398)还是大剑师兰特14 小时前
Flink面试题及详细答案100道(1-20)- 基础概念与架构sleetdream17 小时前
Flink Sql 按分钟或日期统计数据量1892280486118 小时前
NY243NY253美光固态闪存NY257NY260武子康18 小时前
大数据-70 Kafka 日志清理:删除、压缩及混合模式最佳实践CCF_NOI.20 小时前
解锁聚变密码:从微观世界到能源新未来杨荧20 小时前
基于Python的电影评论数据分析系统 Python+Django+Vue.js数据智研21 小时前
【数据分享】上市公司创新韧性数据(2007-2023)