【大数据面试题】010 Flink有哪些算子

一步一个脚印,一天一道大数据面试题

这几天生病了,每天只睡2到4小时,吃药恢复了,就先来点简单的题

Flink 有哪些算子

这是一个挺简单的题,不过有时一问我,我还真只结结巴巴说出 mapflatmap 。那就来列举一下吧。

  • map 对流进行变形,使用函数进行变化,处理
  • flatmapmap类似,变形,使用函数进行变化,但不一样的是会把一个元素变为多个,类似于str.split(",")
  • filter 过滤出想要的元素
  • keyBy 指定某列进行分组,用于后续处理
  • reduce 需结合keyBy,对已分组的数据进行聚合处理
  • join 连接两个流
  • fromSource 获取Source,获取数据源
  • adsSink添加输出的Sink
  • print 打印数据
  • connect 两个流连接一起,跟join不一样的是不一定需要相同的key
相关推荐
无限大620 分钟前
为什么"计算机网络"需要分层设计?——从物理层到应用层
后端·面试·程序员
程序员爱钓鱼33 分钟前
Node.js 编程实战:使用 Postman Swagger 测试接口
后端·面试·node.js
roman_日积跬步-终至千里1 小时前
【大数据架构:架构思想基础】Google三篇论文开启大数据处理序章:(数据存储)分布式架构、(数据计算)并行计算、(数据管理)分片存储
大数据·分布式·架构
CHrisFC1 小时前
中小型第三方环境检测实验室的数字化破局之选——江苏硕晟LIMS
大数据·运维·人工智能
小北方城市网2 小时前
GEO 智变新篇:质效双升 + 责任共生,打造 AI 时代本地商业长效增长引擎
大数据·人工智能·python·数据库架构
神算大模型APi--天枢6462 小时前
自主算力筑基,垂域模型破局:国产硬件架构下的行业大模型训练与微调服务实践
大数据·人工智能·科技·架构·硬件架构
2501_940975802 小时前
AI降重:当学术写作遇上智能算法,如何守住原创底线?
大数据·人工智能
CNRio3 小时前
Day 55:Git的高级技巧:使用Git的worktree管理多个工作目录
大数据·git·elasticsearch
汤姆yu3 小时前
基于python大数据的地震数据可视化分析系统
大数据·python·信息可视化
web小白成长日记3 小时前
自定义 Hooks 的用法和意义详解(结合案例)
前端·css·面试·职场和发展·前端框架