数据仓库面试题集&离线&实时

一、Flink面试问题集

1、flink+kafka 如何保证精准一次

  • 配置
  • 两阶段提交

2、Flink提交方式, 使用pre-job还是yarn-session模式,以及Application模式,好处?

3、Flink UV统计实现

  • set
  • 布隆过滤器+redis 有误差
  • HyperLogLog

4、Flink的CEP实现延迟支付提醒

5、Flink Join方式

6、Time-Watermark

7、动态表

8、Flink数据倾斜如何处理

二、Spark面试问题集

三、数据仓库

酒店行业数据仓库
数据仓库设计

1、数仓搭建规范说一下,表命名规范、数仓分层、数仓主题、数据域、业务域等

2、结合自己负责的业务主线,详细简述一个主题,业务流程、概念模型、实体节点

3、主题域-一级主题-业务过程 ,描述自己在这个过程中做了哪些事情

相关推荐
山沐与山16 分钟前
【Flink】Flink数据源Source详解
大数据·flink
PS12323223 分钟前
隔爆型防爆压力变送器的多信号输出优势
大数据·人工智能
Jackyzhe24 分钟前
Flink源码阅读:Watermark机制
大数据·flink
TG:@yunlaoda360 云老大29 分钟前
如何通过华为云国际站代理商CSBS进行跨Region备份与容灾?
大数据·数据库·华为云
Hello.Reader39 分钟前
Flink Materialized Table Quickstart本地 10 分钟跑通 CONTINUOUS / FULL
大数据·flink
DolphinDB智臾科技41 分钟前
如何用脚本榨出C++级性能?微秒级低延时系统优化深度解析
大数据·c++·时序数据库·低延时·dolphindb
Macbethad1 小时前
网络安全渗透测试技术报告:攻防实践与技术路线分析
大数据
张彦峰ZYF1 小时前
从路径抽象到安全归档 Python 文件组织实战
大数据·python·从路径抽象到安全归档·python 文件组织实战
b***25111 小时前
汽车圆柱电池气动点焊机:串并联组合自动化焊接的核心驱动力
大数据·人工智能
跟着珅聪学java1 小时前
git stash详细教程
大数据·elasticsearch·搜索引擎