一、基础单数据流算子
Map 算子:一对一数据转换,字段修改、数据格式转换
FlatMap 算子:一对多数据拆分,字符串拆分、数组拆分
Filter 算子:数据过滤,剔除脏数据、无效数据
KeyBy 算子:数据流分组,等同于 SQL group by,实时分组核心
二、聚合类算子
sum 求和、max 最大值、min 最小值、reduce 自定义聚合算子,流式持续聚合计算
三、多数据流合并算子
Union:合并多条同类型数据流
Connect:合并不同类型数据流,相互关联处理
四、分流算子
Split 分流、SideOutput 侧输出流,将一条数据流拆分多分支,实现不同数据不同逻辑处理