- 间隔联结只支持事件时间
- 间隔联结如果遇到迟到数据,则会关联不上,比如来了一个5秒的数据,它可以关联前2秒的数据,后3秒的数据,就是可以关联3秒到8秒的数据,然后又来了一个6秒的数据,可以关联4秒到9秒的数据,那么3秒的数据,就永远不会被关联到了,就可以删除了,然后又来了一个迟到数据,比如4秒的数据,可以关联2秒到7秒的数据,但是3秒的数据已经被删除了,所以就关联不上了。对于这种情况,解决办法就是,使用回撤流,比如left join,left join可以设置状态过期时间,这个时间是系统时间,比如我们设置过期时间是5分钟,那么A流的3秒的数据,可以和B流的4秒(迟到数据)的数据关联上,就解决了这个问题。
Flink-间隔联结
青云游子2023-08-10 12:51
相关推荐
智能化咨询1 小时前
Flink受管状态自定义序列化的可演进设计与未来趋势yumgpkpm2 小时前
CMP (类ClouderaCDP7.3(404次编译) )华为鲲鹏Aarch64(ARM)信创环境 查询2100w行 hive 查询策略wudl55665 小时前
Flink 1.20 flink-config.yml 配置详解华东数交5 小时前
企业与国有数据资产:入表全流程管理及资产化闭环理论解析B站_计算机毕业设计之家11 小时前
计算机毕业设计:Python农业数据可视化分析系统 气象数据 农业生产 粮食数据 播种数据 爬虫 Django框架 天气数据 降水量(源码+文档)✅Apache Flink12 小时前
Flink Agents 0.1.0 发布公告潘达斯奈基~14 小时前
在使用spark的applyInPandas方法过程中,遇到类型冲突问题如何解决火星资讯15 小时前
腾多多数字零售模式:从成本转嫁到全生态共赢的破局实践望获linux16 小时前
【实时Linux实战系列】实时 Linux 的自动化基准测试框架金宗汉16 小时前
《宇宙递归拓扑学:基于自指性与拓扑流形的无限逼近模型》