字节广告数开一面 | 实习

  1. 实习内容

  2. 数据建模做了啥,上下游是谁

  3. 数据量大小,具体到每天的表

  4. 数据模型有哪些?

  5. 怎么定位解决实际开发问题的,可以围绕数据倾斜展开

  6. spark任务底层执行过程

7.spark shuffle过程

  1. spark join 底层

  2. aqe底层是怎么实现的

10.为什么做报表要hive2doris?

  1. doris底层,它索引什么类型

  2. doris和hive对比

  3. mysql数据库底层索引,为啥b+树叶子结点范围查找就更快

  4. 数仓分层有什么作用?

  5. spark源码看过吗?

  6. 算法题打家劫舍 空间时间复杂度

面试问:数仓中跨域是放在哪一层?跨域整合和联邦查询有什么区别?

SQL面试提问:NTILE等频分桶和自定义区间分桶到底有什么区别?

SQL如何多字段取极值?| 附多行业案例实战

审批流程数仓建模方案(Hive)| 问的人最多

SQL面试题:计算昨日的"秒杀活动售罄率"与"拼团活动成团率"

面试提问:JOIN 之后数据行数变多是什么原因?如何排查?

业务反馈你提供的用户活跃度指标和他们预期的不符,该如何排查?| 滴滴

用户问:指标平台与本体论有什么区别?

读者问:多维场景下,维度不存在时,同环比如何计算?

同环比分析:为什么生产环境中必须用LEFT JOIN,而不用LAG?| 附实战案例

零售行业数仓本体建模落地方案

SQL库存消耗数据开发:制造业物料管理数据方案

数据治理之后如何体现收益?| 阿里云

面试提问:什么是基于业务过程的数据建模?

数仓之DWB层完整设计方案与实战

相关推荐
Databend2 小时前
2KB histogram 背后:Databend 如何低成本追踪长尾延迟
大数据·数据分析·agent
Databend4 小时前
从湖仓升级为 Agent 时代的数据控制面,Snowflake 和 Databricks 有哪些布局
大数据·数据库·agent
用户852495071845 小时前
解密 JavaScript 中的 this:谁才是真正的调用者?
javascript·面试
Heo5 小时前
Vite进阶用法详解
前端·javascript·面试
洛卡卡了5 小时前
Claude Code rules 要怎么用,团队协作时如何统一代码规范呢?
面试·agent·claude
不好听6138 小时前
JavaScript 的 this 到底指向谁?
javascript·面试
烬羽9 小时前
面试官:聊聊 LocalStorage 和 this 指向?看这篇就够了
面试·程序员
weedsfly9 小时前
JS垃圾回收:从原理到项目实战,彻底根治内存泄漏
前端·javascript·面试