字节广告数开一面 | 实习

  1. 实习内容

  2. 数据建模做了啥,上下游是谁

  3. 数据量大小,具体到每天的表

  4. 数据模型有哪些?

  5. 怎么定位解决实际开发问题的,可以围绕数据倾斜展开

  6. spark任务底层执行过程

7.spark shuffle过程

  1. spark join 底层

  2. aqe底层是怎么实现的

10.为什么做报表要hive2doris?

  1. doris底层,它索引什么类型

  2. doris和hive对比

  3. mysql数据库底层索引,为啥b+树叶子结点范围查找就更快

  4. 数仓分层有什么作用?

  5. spark源码看过吗?

  6. 算法题打家劫舍 空间时间复杂度

面试问:数仓中跨域是放在哪一层?跨域整合和联邦查询有什么区别?

SQL面试提问:NTILE等频分桶和自定义区间分桶到底有什么区别?

SQL如何多字段取极值?| 附多行业案例实战

审批流程数仓建模方案(Hive)| 问的人最多

SQL面试题:计算昨日的"秒杀活动售罄率"与"拼团活动成团率"

面试提问:JOIN 之后数据行数变多是什么原因?如何排查?

业务反馈你提供的用户活跃度指标和他们预期的不符,该如何排查?| 滴滴

用户问:指标平台与本体论有什么区别?

读者问:多维场景下,维度不存在时,同环比如何计算?

同环比分析:为什么生产环境中必须用LEFT JOIN,而不用LAG?| 附实战案例

零售行业数仓本体建模落地方案

SQL库存消耗数据开发:制造业物料管理数据方案

数据治理之后如何体现收益?| 阿里云

面试提问:什么是基于业务过程的数据建模?

数仓之DWB层完整设计方案与实战

相关推荐
2402_881319302 小时前
引入 Redis 分布式锁解决并发脏写 (Dirty Write)-AI模拟面试的构建rag部分
redis·分布式·面试
沸点小助手3 小时前
「国产龙虾谁能打过OpenClaw & 你敢让微信龙虾碰代码吗」沸点获奖名单公示|本周互动话题上新🎊
前端·后端·面试
studyForMokey3 小时前
【Android面试】RecylerView专题
android·spring·面试
T06205143 小时前
【面板数据】地级市人力资本水平测算数据(1990-2024年)
大数据
wunaiqiezixin3 小时前
MyString类的常见面试问题
c++·面试
TDengine (老段)3 小时前
TDengine IDMP 可视化 —— 饼图
大数据·数据库·人工智能·物联网·时序数据库·tdengine·涛思数据
lizhongxuan3 小时前
LLM Wiki:让大模型替你打理知识库的完整指南
前端·后端·面试
Flying pigs~~3 小时前
从“踩坑”到“可控”:大模型 Prompt 工程实战总结与进阶方法论
大数据·人工智能·大模型·prompt·提示词工程
2501_933329554 小时前
AI驱动媒介宣发:Infoseek舆情系统的技术架构与公关实战
数据仓库·人工智能·重构·数据库开发