【大数据面试题】010 Flink有哪些算子

一步一个脚印,一天一道大数据面试题

这几天生病了,每天只睡2到4小时,吃药恢复了,就先来点简单的题

Flink 有哪些算子

这是一个挺简单的题,不过有时一问我,我还真只结结巴巴说出 mapflatmap 。那就来列举一下吧。

  • map 对流进行变形,使用函数进行变化,处理
  • flatmapmap类似,变形,使用函数进行变化,但不一样的是会把一个元素变为多个,类似于str.split(",")
  • filter 过滤出想要的元素
  • keyBy 指定某列进行分组,用于后续处理
  • reduce 需结合keyBy,对已分组的数据进行聚合处理
  • join 连接两个流
  • fromSource 获取Source,获取数据源
  • adsSink添加输出的Sink
  • print 打印数据
  • connect 两个流连接一起,跟join不一样的是不一定需要相同的key
相关推荐
葫芦和十三7 小时前
图解 MongoDB 18|复制集拓扑:Primary、Secondary 和 Arbiter 的分工
后端·mongodb·面试
葫芦和十三13 小时前
图解 MongoDB 15|journal 与持久化:写入怎么不丢,崩溃怎么恢复
后端·mongodb·面试
葫芦和十三13 小时前
图解 MongoDB 16|压缩:snappy、zstd 和 zlib 的取舍
后端·mongodb·面试
labixiong17 小时前
实现一个能跑的迷你版Promise(一)
前端·javascript·面试
weedsfly1 天前
还在用 Axios?你可能需要重新理解 XHR 与 Fetch
前端·javascript·面试
大大大大晴天1 天前
Hudi技术内幕:深入解析Index索引机制
大数据
Hyyy1 天前
什么是bun?和pnpm有什么区别
前端·面试·bun
阿里云大数据AI技术1 天前
Flink Forward Asia 2026 深圳启幕:Agentic Streaming for AI,开启实时智能新范式
大数据·flink
葫芦和十三1 天前
图解 MongoDB 14|Cache 与淘汰:WiredTiger 的内存治理
后端·mongodb·面试
SelectDB2 天前
阶跃星辰基于 SelectDB 构建 PB 级 Agent 可观测平台
大数据·数据库·aigc