字节广告数开一面 | 实习

  1. 实习内容

  2. 数据建模做了啥,上下游是谁

  3. 数据量大小,具体到每天的表

  4. 数据模型有哪些?

  5. 怎么定位解决实际开发问题的,可以围绕数据倾斜展开

  6. spark任务底层执行过程

7.spark shuffle过程

  1. spark join 底层

  2. aqe底层是怎么实现的

10.为什么做报表要hive2doris?

  1. doris底层,它索引什么类型

  2. doris和hive对比

  3. mysql数据库底层索引,为啥b+树叶子结点范围查找就更快

  4. 数仓分层有什么作用?

  5. spark源码看过吗?

  6. 算法题打家劫舍 空间时间复杂度

面试问:数仓中跨域是放在哪一层?跨域整合和联邦查询有什么区别?

SQL面试提问:NTILE等频分桶和自定义区间分桶到底有什么区别?

SQL如何多字段取极值?| 附多行业案例实战

审批流程数仓建模方案(Hive)| 问的人最多

SQL面试题:计算昨日的"秒杀活动售罄率"与"拼团活动成团率"

面试提问:JOIN 之后数据行数变多是什么原因?如何排查?

业务反馈你提供的用户活跃度指标和他们预期的不符,该如何排查?| 滴滴

用户问:指标平台与本体论有什么区别?

读者问:多维场景下,维度不存在时,同环比如何计算?

同环比分析:为什么生产环境中必须用LEFT JOIN,而不用LAG?| 附实战案例

零售行业数仓本体建模落地方案

SQL库存消耗数据开发:制造业物料管理数据方案

数据治理之后如何体现收益?| 阿里云

面试提问:什么是基于业务过程的数据建模?

数仓之DWB层完整设计方案与实战

相关推荐
王苏安说钢材A21 分钟前
酒钢拓展多款高端不锈钢品种规格
大数据
AI人工智能+电脑小能手9 小时前
【大白话说Java面试题】【Java基础篇】第15题:JDK1.7中HashMap扩容为什么会发生死循环?如何解决
java·开发语言·数据结构·后端·面试·哈希算法
Moment11 小时前
2026 年,AI 全栈时代到了,前端简历别再只写前端技术了 🫠🫠🫠
前端·后端·面试
白晨并不是很能熬夜12 小时前
【PRC】第 2 篇:Netty 通信层 — NIO 模型 + 自定义协议 + 心跳
java·开发语言·后端·面试·rpc·php·nio
折哥的程序人生 · 物流技术专研13 小时前
效率翻倍:出版社多库区复合型 ABC 仓储拣选体系全解(含直发/越库/箱式立库/托盘立库)
大数据
Elastic 中国社区官方博客13 小时前
Elasticsearch:智能搜索 - AI builder 及 skills
大数据·人工智能·elasticsearch·搜索引擎·ai·信息可视化·全文检索
M ? A14 小时前
Vue 的 scoped 样式穿透 React 不支持?用 VuReact 编译就行
前端·javascript·vue.js·react.js·面试·开源·vureact
跨境摸鱼14 小时前
低价模型承压阶段跨境品牌如何把重心转向复购与客单
大数据·人工智能·跨境电商·亚马逊·跨境
极客沐森14 小时前
如何取消大批量的超时订单,关于超时架构的探讨
面试·架构
果汁华15 小时前
LangGraph:构建状态化 AI 代理的革命性编排框架
大数据·人工智能