- 间隔联结只支持事件时间
- 间隔联结如果遇到迟到数据,则会关联不上,比如来了一个5秒的数据,它可以关联前2秒的数据,后3秒的数据,就是可以关联3秒到8秒的数据,然后又来了一个6秒的数据,可以关联4秒到9秒的数据,那么3秒的数据,就永远不会被关联到了,就可以删除了,然后又来了一个迟到数据,比如4秒的数据,可以关联2秒到7秒的数据,但是3秒的数据已经被删除了,所以就关联不上了。对于这种情况,解决办法就是,使用回撤流,比如left join,left join可以设置状态过期时间,这个时间是系统时间,比如我们设置过期时间是5分钟,那么A流的3秒的数据,可以和B流的4秒(迟到数据)的数据关联上,就解决了这个问题。
Flink-间隔联结
青云游子2023-08-10 12:51
相关推荐
boonya4 小时前
Elasticsearch核心原理与面试总结TDengine (老段)5 小时前
TDengine 时间函数 WEEKDAY() 用户手册LQ深蹲不写BUG7 小时前
ElasticSearch 基础内容深度解析Debug_Snail9 小时前
【营销策略算法】关联规则学习-购物篮分析BYSJMG10 小时前
计算机毕设大数据方向:基于Spark+Hadoop的餐饮外卖平台数据分析系统【源码+文档+调试】java水泥工11 小时前
基于Echarts+HTML5可视化数据大屏展示-茶叶种植大数据溯源平台华略创新12 小时前
标准化与定制化的平衡艺术:制造企业如何通过灵活配置释放系统价值半夏陌离14 小时前
SQL 实战指南:电商订单数据分析(订单 / 用户 / 商品表关联 + 统计需求)成长之路51415 小时前
【面板数据】各省制造业出口技术复杂度数据集(2010-2023年)