一、Flink面试问题集
- 配置
- 两阶段提交
2、Flink提交方式, 使用pre-job还是yarn-session模式,以及Application模式,好处?
- set
- 布隆过滤器+redis 有误差
- HyperLogLog
4、Flink的CEP实现延迟支付提醒
5、Flink Join方式
7、动态表
8、Flink数据倾斜如何处理
二、Spark面试问题集
三、数据仓库
1、数仓搭建规范说一下,表命名规范、数仓分层、数仓主题、数据域、业务域等
2、结合自己负责的业务主线,详细简述一个主题,业务流程、概念模型、实体节点
3、主题域-一级主题-业务过程 ,描述自己在这个过程中做了哪些事情