数据仓库面试题集&离线&实时

一、Flink面试问题集

1、flink+kafka 如何保证精准一次

  • 配置
  • 两阶段提交

2、Flink提交方式, 使用pre-job还是yarn-session模式,以及Application模式,好处?

3、Flink UV统计实现

  • set
  • 布隆过滤器+redis 有误差
  • HyperLogLog

4、Flink的CEP实现延迟支付提醒

5、Flink Join方式

6、Time-Watermark

7、动态表

8、Flink数据倾斜如何处理

二、Spark面试问题集

三、数据仓库

酒店行业数据仓库
数据仓库设计

1、数仓搭建规范说一下,表命名规范、数仓分层、数仓主题、数据域、业务域等

2、结合自己负责的业务主线,详细简述一个主题,业务流程、概念模型、实体节点

3、主题域-一级主题-业务过程 ,描述自己在这个过程中做了哪些事情

相关推荐
时序数据说1 小时前
为什么时序数据库IoTDB选择Java作为开发语言
java·大数据·开发语言·数据库·物联网·时序数据库·iotdb
Codebee1 小时前
OneCode图表配置速查手册
大数据·前端·数据可视化
Jamie201901062 小时前
高档宠物食品对宠物的健康益处有哪些?
大数据·人工智能
陈敬雷-充电了么-CEO兼CTO2 小时前
推荐算法系统系列>推荐数据仓库集市的ETL数据处理
大数据·数据库·数据仓库·数据挖掘·数据分析·etl·推荐算法
小高不会迪斯科3 小时前
MIT 6.824学习心得(1) 浅谈分布式系统概论与MapReduce
大数据·mapreduce
TDengine (老段)3 小时前
使用 StatsD 向 TDengine 写入
java·大数据·数据库·时序数据库·iot·tdengine·涛思数据
Gauss松鼠会3 小时前
GaussDB权限管理:从RBAC到精细化控制的企业级安全实践
大数据·数据库·安全·database·gaussdb
时序数据说4 小时前
时序数据库IoTDB用户自定义函数(UDF)使用指南
大数据·数据库·物联网·开源·时序数据库·iotdb
大师兄带你刨AI4 小时前
「AI产业」| 《中国信通院&华为:智能体技术和应用研究报告》
大数据·人工智能
武子康5 小时前
大数据-31 ZooKeeper 内部原理 Leader选举 ZAB协议
大数据·后端·zookeeper