尚硅谷大数据项目《在线教育之离线数仓》笔记005

视频地址:尚硅谷大数据项目《在线教育之离线数仓》_哔哩哔哩_bilibili

目录

[第10章 数仓开发之DWS层](#第10章 数仓开发之DWS层)

P071

P072

P073

P074

P075

P076

P077

P078

P079

P080

P081

P082

P083

P084

P085

P086


第10章 数仓开发之DWS层

P071

设计要点:

(1)DWS层的设计参考指标体系

(2)DWS层的数据存储格式为orc列式存储+snappy压缩。

(3)DWS层表名的命名规范为dws_数据域_统计粒度_业务过程_统计周期(1d/nd/td)。

注:1d标识最近1日,nd表示最近n日,td表示历史至今。

P072

10.1.1 交易域用户粒度用户加购最近1日汇总表

10.1.2 交易域用户粒度用户支付最近1日汇总表

P073

10.1.3 交易域会话粒度用户下单最近1日汇总表

P074

10.1.4 考试域试卷粒度考试最近1日汇总表

P075

10.1.5 考试域试卷分数段粒度最近1日汇总表

P076

10.1.6 考试域题目粒度考试最近1日汇总表

P077

10.1.7 流量域会话粒度页面浏览最近1日汇总表

P078

10.1.8 数据装载脚本

P079

10.2.1 交易域用户粒度用户加购最近n日汇总表

10.2.2 交易域用户粒度用户支付最近n日汇总表

P080

10.2.3 考试域试卷粒度考试最近n日汇总表

P081

10.2.4 考试域试卷分数段粒度最近n日汇总表

10.2.5 考试域题目粒度考试最近n日汇总表

P082

10.2.6 数据装载脚本

P083

10.3.1 交易域用户粒度下单历史至今汇总表

P084

10.3.2 交易域用户粒度用户支付历史至今汇总表

P085

10.3.3 用户域用户粒度用户登录历史至今汇总表

P086

10.3.4 数据装载脚本

相关推荐
SelectDB1 天前
易车 × Apache Doris:构建湖仓一体新架构,加速 AI 业务融合实践
大数据·agent·mcp
武子康1 天前
大数据-241 离线数仓 - 实战:电商核心交易数据模型与 MySQL 源表设计(订单/商品/品类/店铺/支付)
大数据·后端·mysql
IvanCodes1 天前
一、消息队列理论基础与Kafka架构价值解析
大数据·后端·kafka
武子康2 天前
大数据-240 离线数仓 - 广告业务 Hive ADS 实战:DataX 将 HDFS 分区表导出到 MySQL
大数据·后端·apache hive
字节跳动数据平台3 天前
5000 字技术向拆解 | 火山引擎多模态数据湖如何释放模思智能的算法生产力
大数据
武子康3 天前
大数据-239 离线数仓 - 广告业务实战:Flume 导入日志到 HDFS,并完成 Hive ODS/DWD 分层加载
大数据·后端·apache hive
字节跳动数据平台4 天前
代码量减少 70%、GPU 利用率达 95%:火山引擎多模态数据湖如何释放模思智能的算法生产力
大数据
得物技术4 天前
深入剖析Spark UI界面:参数与界面详解|得物技术
大数据·后端·spark
武子康4 天前
大数据-238 离线数仓 - 广告业务 Hive分析实战:ADS 点击率、购买率与 Top100 排名避坑
大数据·后端·apache hive
武子康5 天前
大数据-237 离线数仓 - Hive 广告业务实战:ODS→DWD 事件解析、广告明细与转化分析落地
大数据·后端·apache hive