【Flink-scala】DataStream编程模型总结

系列文章目录

1.【Flink-Scala】DataStream编程模型之数据源、数据转换、数据输出

2.【Flink-scala】DataStream编程模型之 窗口的划分-时间概念-窗口计算程序

3.【Flink-scala】DataStream编程模型之窗口计算-触发器-驱逐器

4.【Flink-scala】DataStream编程模型之水位线

5.【Flink-scala】DataStream编程模型之延迟数据处理

6.【Flink-scala】DataStream编程模型之状态编程

文章目录


总结

DataStream API是Flink的核心,因为Flink和其他计算框架(比如Spark、MapReduce等)相比,其最大的优势就在于强大的流计算功能。本章首先介绍了在使用DataStream接口编程中的基本操作,包括数据源、数据转换、数据输出、窗口的划分等。

对于流式数据处理,最大的特点是数据上具有时间的属性特征,Flink根据时间产生位置的不同,将时间划分为三种,分别为事件生成时间、时间接入时间和事件处理时间,本章内容对三种时间概念进行了详细介绍。

窗口计算时流式计算中非常常用的数据计算方式之一,通过按照固定时间或长度将数据流切分成不同的窗口,然后对数据进行相应的聚合计算,就可以得到一定时间范围内的统计结果。本章内容介绍了窗口的型以及窗口计算函数。

通常情况下,由于网络或者系统等外部因素的影响三种类,事件数据往往不能及时传输至Flink系统中,从而导致数据乱序到达或者延迟到达的问题。本章介绍了如何采用水位线机制解决这类问题。本章最后介绍了有状态计算的编程方法。

相关推荐
环小保13 小时前
半导体制造的绿色“隐形”战场:废气治理如何“精准狙击”?
大数据·人工智能
ws20190714 小时前
锚定华南产业高地,2026广州汽车轻量化展解码行业升级新机遇
大数据·人工智能·科技·汽车
金融小师妹14 小时前
基于多因子定价模型解析:美元强势与利率预期重构驱动的金价8连跌机制
大数据·人工智能·svn·能源
QYR_Jodie14 小时前
全球聚硫醇固化剂市场:2026-2032年CAGR7.0%,2032年规模2.4亿美元
大数据·人工智能
AI营销快线14 小时前
AI营销如何破解增长瓶颈?原圈科技以智能体驱动高效增长
大数据·人工智能
天远Date Lab14 小时前
Python实战:基于天远二手车估值API构建企业车队资产数字化管理方案
大数据·人工智能·python
北极九章ArcticData14 小时前
销售管理团队如何用ChatBI实现数据驱动管理?
大数据·人工智能·数据分析·chatbi
jerryinwuhan14 小时前
Spark安装配置2
大数据·分布式·spark
恼书:-(空寄14 小时前
深入理解 Elasticsearch 写入与查询机制
大数据·elasticsearch·搜索引擎
TDengine (老段)14 小时前
TDengine IDMP 0-阅读指南
大数据·数据库·人工智能·时序数据库·tdengine·涛思数据