字节数开一面

目录

⏰时长:1h

[1. 自我介绍](#1. 自我介绍)

[2. 实习经历 难点](#2. 实习经历 难点)

[3. 数据倾斜](#3. 数据倾斜)

[4. CTE的执行计划](#4. CTE的执行计划)

[5. spark stage怎么划分](#5. spark stage怎么划分)

[6. 什么算子会触发宽依赖](#6. 什么算子会触发宽依赖)

[7. hive内部表和外部表区别](#7. hive内部表和外部表区别)

[8. HDFS小文件过多会有什么问题](#8. HDFS小文件过多会有什么问题)

[9. 对数仓分层的理解](#9. 对数仓分层的理解)

[10. 数仓业务域和主题域的区别](#10. 数仓业务域和主题域的区别)

手撕:

[1. sql:查询某段时间借书的uid](#1. sql:查询某段时间借书的uid)

[2. sql:查询至少连续两天登录的用户](#2. sql:查询至少连续两天登录的用户)

[3. 算法:有序重复数组返回n出现的次数](#3. 算法:有序重复数组返回n出现的次数)

往期精彩


⏰时长:1h

1. 自我介绍

2. 实习经历 难点

3. 数据倾斜

4. CTE的执行计划

5. spark stage怎么划分

6. 什么算子会触发宽依赖

7. hive内部表和外部表区别

8. HDFS小文件过多会有什么问题

9. 对数仓分层的理解

10. 数仓业务域和主题域的区别

手撕:

1. sql:查询某段时间借书的uid

2. sql:查询至少连续两天登录的用户

3. 算法:有序重复数组返回n出现的次数

往期精彩

面试提问:ADS层SLA如何保障?

数仓宽表灵魂提问:如何将不同业务粒度的事实数据与维度信息整合到一张宽表中?

读者提问:如何在一张宽表上做出不同业务过程、统计不同粒度的指标?

面试提问:Hive中如何高效的判断两张表数据是否完全一致?

读者提问:如何在一张宽表上做出不同业务过程、统计不同粒度的指标?

百度面试提问:数仓中什么是交叉维度,如何解决?| 附场景案例

面试提问:请描述XX业务宽表的字段构成、描述对象和粒度?| 回答模板

面试官灵魂提问:数仓ADS层需要分区吗?

基于 DolphineScheduler 中使用计数器方式实现的双表切换

面试提问:SQL 查询无数据时如何强制返回一行 0 | 通用兜底方案全解析

相关推荐
金融小师妹10 分钟前
基于多模态宏观建模与历史序列对齐:原油能源供给冲击的“类1970年代”演化路径与全球应对机制再评估
大数据·人工智能·能源
播播资源26 分钟前
OpenAI2026 年 3 月 18 日最新 gpt-5.4-nano模型:AI 智能体的“神经末梢”,以极低成本驱动高频任务
大数据·人工智能·gpt
GJGCY2 小时前
中小企业财务AI工具技术评测:四大类别架构差异与选型维度
大数据·人工智能·ai·架构·财务·智能体
九河云2 小时前
云上安全运营中心(SOC)建设:从被动防御到主动狩猎
大数据·人工智能·安全·架构·数字化转型
武子康2 小时前
大数据-252 离线数仓 - Airflow + Crontab 入门实战:定时调度、DAG 编排与常见报错排查
大数据·后端·apache hive
jinanwuhuaguo2 小时前
OpenClaw、飞书、Claude Code、Codex:四维AI生态体系的深度解构与颗粒化对比分析
大数据·人工智能·学习·飞书·openclaw
Rubin智造社2 小时前
# OpenClaude命令实战|核心控制三剑客/reasoning+/verbose+/status 实操指南
大数据·人工智能
重庆小透明3 小时前
【面试问题】java字节八股部分
java·面试·职场和发展
华奥系科技3 小时前
智慧经济新格局:解码社区、园区与城市一体化建设逻辑
大数据·人工智能·科技·物联网·安全
TDengine (老段)4 小时前
TDengine IDMP 组态面板 —— 画布
大数据·数据库·物联网·时序数据库·tdengine·涛思数据