【大数据面试题】010 Flink有哪些算子

一步一个脚印,一天一道大数据面试题

这几天生病了,每天只睡2到4小时,吃药恢复了,就先来点简单的题

Flink 有哪些算子

这是一个挺简单的题,不过有时一问我,我还真只结结巴巴说出 mapflatmap 。那就来列举一下吧。

  • map 对流进行变形,使用函数进行变化,处理
  • flatmapmap类似,变形,使用函数进行变化,但不一样的是会把一个元素变为多个,类似于str.split(",")
  • filter 过滤出想要的元素
  • keyBy 指定某列进行分组,用于后续处理
  • reduce 需结合keyBy,对已分组的数据进行聚合处理
  • join 连接两个流
  • fromSource 获取Source,获取数据源
  • adsSink添加输出的Sink
  • print 打印数据
  • connect 两个流连接一起,跟join不一样的是不一定需要相同的key
相关推荐
swipe40 分钟前
JavaScript 对象操作进阶:从属性描述符到对象创建模式
前端·javascript·面试
港股研究社1 小时前
腾讯音乐的多元增长新路径:音乐IP经济
大数据·人工智能·tcp/ip
GIOTTO情2 小时前
技术解析:Infoseek基于AI重构媒介投放全链路,适配2026年奥斯卡高端投放场景
大数据·人工智能
Data-Miner2 小时前
46页精品PPT | 数据治理大数据平台资源规划与建设解决方案
大数据
信道者2 小时前
乌克兰开放战场数据宝库:AI无人机迎来“实战级”进化
大数据·人工智能·无人机
margu_1682 小时前
【Elasticsearch】es7.2单节点集群内索引重组迁移
大数据·elasticsearch
武子康2 小时前
大数据-251 离线数仓 - Airflow 安装部署避坑指南:1.10.11 与 2.x 命令差异、MySQL 配置与错误排查
大数据·后端·apache hive
Elastic 中国社区官方博客2 小时前
用于 Elasticsearch 的 Gemini CLI 扩展,包含工具和技能
大数据·开发语言·人工智能·elasticsearch·搜索引擎·全文检索
星辰_mya3 小时前
ZooKeeper 分布式锁:强一致性下的“排队”哲学
分布式·zookeeper·云原生·面试·分布式锁