字节数开一面

目录

⏰时长:1h

[1. 自我介绍](#1. 自我介绍)

[2. 实习经历 难点](#2. 实习经历 难点)

[3. 数据倾斜](#3. 数据倾斜)

[4. CTE的执行计划](#4. CTE的执行计划)

[5. spark stage怎么划分](#5. spark stage怎么划分)

[6. 什么算子会触发宽依赖](#6. 什么算子会触发宽依赖)

[7. hive内部表和外部表区别](#7. hive内部表和外部表区别)

[8. HDFS小文件过多会有什么问题](#8. HDFS小文件过多会有什么问题)

[9. 对数仓分层的理解](#9. 对数仓分层的理解)

[10. 数仓业务域和主题域的区别](#10. 数仓业务域和主题域的区别)

手撕:

[1. sql:查询某段时间借书的uid](#1. sql:查询某段时间借书的uid)

[2. sql:查询至少连续两天登录的用户](#2. sql:查询至少连续两天登录的用户)

[3. 算法:有序重复数组返回n出现的次数](#3. 算法:有序重复数组返回n出现的次数)

往期精彩


⏰时长:1h

1. 自我介绍

2. 实习经历 难点

3. 数据倾斜

4. CTE的执行计划

5. spark stage怎么划分

6. 什么算子会触发宽依赖

7. hive内部表和外部表区别

8. HDFS小文件过多会有什么问题

9. 对数仓分层的理解

10. 数仓业务域和主题域的区别

手撕:

1. sql:查询某段时间借书的uid

2. sql:查询至少连续两天登录的用户

3. 算法:有序重复数组返回n出现的次数

往期精彩

面试提问:ADS层SLA如何保障?

数仓宽表灵魂提问:如何将不同业务粒度的事实数据与维度信息整合到一张宽表中?

读者提问:如何在一张宽表上做出不同业务过程、统计不同粒度的指标?

面试提问:Hive中如何高效的判断两张表数据是否完全一致?

读者提问:如何在一张宽表上做出不同业务过程、统计不同粒度的指标?

百度面试提问:数仓中什么是交叉维度,如何解决?| 附场景案例

面试提问:请描述XX业务宽表的字段构成、描述对象和粒度?| 回答模板

面试官灵魂提问:数仓ADS层需要分区吗?

基于 DolphineScheduler 中使用计数器方式实现的双表切换

面试提问:SQL 查询无数据时如何强制返回一行 0 | 通用兜底方案全解析

相关推荐
Acrelhuang1 小时前
覆盖全场景需求:Acrel-1000 变电站综合自动化系统的技术亮点与应用
大数据·网络·人工智能·笔记·物联网
忙碌5441 小时前
智能应用开发指南:深度学习、大数据与微服务的融合之道
大数据·深度学习·微服务
萤丰信息2 小时前
智慧园区系统:开启园区管理与运营的新时代
java·大数据·人工智能·安全·智慧城市·智慧园区
音视频牛哥2 小时前
从 SmartMediaKit 设计探讨音视频工程师的面试与能力评估框架
程序人生·职场和发展·音视频·rtsp播放器·rtmp播放器·音视频工程师面试·音视频程序员面试题
Q26433650232 小时前
【有源码】基于Hadoop+Spark的起点小说网大数据可视化分析系统-基于Python大数据生态的网络文学数据挖掘与可视化系统
大数据·hadoop·python·信息可视化·数据分析·spark·毕业设计
洞见新研社2 小时前
家庭机器人,从科幻到日常的二十年突围战
大数据·人工智能·机器人
筑梦之人4 小时前
Spark-3.5.7文档2 - RDD 编程指南
大数据·分布式·spark
艾莉丝努力练剑5 小时前
【C++:红黑树】深入理解红黑树的平衡之道:从原理、变色、旋转到完整实现代码
大数据·开发语言·c++·人工智能·红黑树
ImproveJin5 小时前
Flink Source源码解析
大数据·flink
PONY LEE5 小时前
Flink Rebalance触发乱序的问题
大数据·flink