字节广告数开一面 | 实习

  1. 实习内容

  2. 数据建模做了啥,上下游是谁

  3. 数据量大小,具体到每天的表

  4. 数据模型有哪些?

  5. 怎么定位解决实际开发问题的,可以围绕数据倾斜展开

  6. spark任务底层执行过程

7.spark shuffle过程

  1. spark join 底层

  2. aqe底层是怎么实现的

10.为什么做报表要hive2doris?

  1. doris底层,它索引什么类型

  2. doris和hive对比

  3. mysql数据库底层索引,为啥b+树叶子结点范围查找就更快

  4. 数仓分层有什么作用?

  5. spark源码看过吗?

  6. 算法题打家劫舍 空间时间复杂度

面试问:数仓中跨域是放在哪一层?跨域整合和联邦查询有什么区别?

SQL面试提问:NTILE等频分桶和自定义区间分桶到底有什么区别?

SQL如何多字段取极值?| 附多行业案例实战

审批流程数仓建模方案(Hive)| 问的人最多

SQL面试题:计算昨日的"秒杀活动售罄率"与"拼团活动成团率"

面试提问:JOIN 之后数据行数变多是什么原因?如何排查?

业务反馈你提供的用户活跃度指标和他们预期的不符,该如何排查?| 滴滴

用户问:指标平台与本体论有什么区别?

读者问:多维场景下,维度不存在时,同环比如何计算?

同环比分析:为什么生产环境中必须用LEFT JOIN,而不用LAG?| 附实战案例

零售行业数仓本体建模落地方案

SQL库存消耗数据开发:制造业物料管理数据方案

数据治理之后如何体现收益?| 阿里云

面试提问:什么是基于业务过程的数据建模?

数仓之DWB层完整设计方案与实战

相关推荐
syc7890123几秒前
Vibe Coding实战对比:终端迭代与可视化AI IDE的真实开发差异
大数据·ide·人工智能
嵌入式ZYXC10 分钟前
第9篇:《面试题:ADC前端为什么要加运放跟随器?什么情况下可以不加?》
stm32·单片机·嵌入式硬件·面试·职场和发展
sa1002712 分钟前
api大数据
大数据
roman_日积跬步-终至千里16 分钟前
【AI Engineering】Loop Engineering初探:在不确定性中构造确定性的工程方法
大数据·人工智能
Haodukeji31 分钟前
2026年上海墙面投影互动品牌新趋势,科技与艺术的完美融合
面试
Upsy-Daisy32 分钟前
Hermes Agent 学习笔记 06:Skills 系统,Agent 如何把经验沉淀为可复用能力?
大数据·elasticsearch·搜索引擎
YangYang9YangYan1 小时前
学数据分析对应用统计学与大数据专业的价值
大数据·数据挖掘·数据分析
上海蓝色星球1 小时前
从 “算量工具“ 到 “造价智能 ERP“:蓝色星球造价机器人如何重构造价行业的核心逻辑
大数据·重构·机器人
木心术11 小时前
在NVIDIA DGX Spark上部署NemoClaw的实际操作方案以及实际应用便利性。
大数据·分布式·spark
EDA365电子论坛1 小时前
AI 赋能 BOM 编制全流程,彻底解决型号 / 封装 / 精度 / 尾缀写错问题
大数据·人工智能