数据仓库面试题集&离线&实时

一、Flink面试问题集

1、flink+kafka 如何保证精准一次

  • 配置
  • 两阶段提交

2、Flink提交方式, 使用pre-job还是yarn-session模式,以及Application模式,好处?

3、Flink UV统计实现

  • set
  • 布隆过滤器+redis 有误差
  • HyperLogLog

4、Flink的CEP实现延迟支付提醒

5、Flink Join方式

6、Time-Watermark

7、动态表

8、Flink数据倾斜如何处理

二、Spark面试问题集

三、数据仓库

酒店行业数据仓库
数据仓库设计

1、数仓搭建规范说一下,表命名规范、数仓分层、数仓主题、数据域、业务域等

2、结合自己负责的业务主线,详细简述一个主题,业务流程、概念模型、实体节点

3、主题域-一级主题-业务过程 ,描述自己在这个过程中做了哪些事情

相关推荐
Data-Miner44 分钟前
集团数字化转型大数据平台整体建设方案
大数据
guslegend1 小时前
大模型驱动大数据SRE智能运维
大数据·运维
跨境小彭2 小时前
2026 Temu 合规新玩法,凌风 ERP 优化 POD 运营效率
大数据·跨境电商·temu·shein
weixin_397574093 小时前
从“点状试点“到“全面智能化“:制造企业AI落地的现实路径
大数据·人工智能·制造
志栋智能3 小时前
超自动化巡检:知识沉淀与团队协作的新载体
大数据·运维·网络·数据库·人工智能·自动化
Old Uncle Tom4 小时前
循环工程(loop engineering)
大数据
跨境数据猎手4 小时前
淘宝大数据技术在电商行业的应用
大数据
阿部多瑞 ABU4 小时前
铁三角:泛二次元奶头乐经济的结构分析及其人口后果
大数据·人工智能
吴卫斌4 小时前
波动率控制仓位系列(一):满仓轮动的“过山车”困境
大数据·python·股票·量化交易
AI焦点4 小时前
2026年AI应用架构:如何避坑并选对API聚合中转服务?
大数据·人工智能·架构