尚硅谷大数据项目《在线教育之离线数仓》笔记005

视频地址:尚硅谷大数据项目《在线教育之离线数仓》_哔哩哔哩_bilibili

目录

[第10章 数仓开发之DWS层](#第10章 数仓开发之DWS层)

P071

P072

P073

P074

P075

P076

P077

P078

P079

P080

P081

P082

P083

P084

P085

P086


第10章 数仓开发之DWS层

P071

设计要点:

(1)DWS层的设计参考指标体系

(2)DWS层的数据存储格式为orc列式存储+snappy压缩。

(3)DWS层表名的命名规范为dws_数据域_统计粒度_业务过程_统计周期(1d/nd/td)。

注:1d标识最近1日,nd表示最近n日,td表示历史至今。

P072

10.1.1 交易域用户粒度用户加购最近1日汇总表

10.1.2 交易域用户粒度用户支付最近1日汇总表

P073

10.1.3 交易域会话粒度用户下单最近1日汇总表

P074

10.1.4 考试域试卷粒度考试最近1日汇总表

P075

10.1.5 考试域试卷分数段粒度最近1日汇总表

P076

10.1.6 考试域题目粒度考试最近1日汇总表

P077

10.1.7 流量域会话粒度页面浏览最近1日汇总表

P078

10.1.8 数据装载脚本

P079

10.2.1 交易域用户粒度用户加购最近n日汇总表

10.2.2 交易域用户粒度用户支付最近n日汇总表

P080

10.2.3 考试域试卷粒度考试最近n日汇总表

P081

10.2.4 考试域试卷分数段粒度最近n日汇总表

10.2.5 考试域题目粒度考试最近n日汇总表

P082

10.2.6 数据装载脚本

P083

10.3.1 交易域用户粒度下单历史至今汇总表

P084

10.3.2 交易域用户粒度用户支付历史至今汇总表

P085

10.3.3 用户域用户粒度用户登录历史至今汇总表

P086

10.3.4 数据装载脚本

相关推荐
Lx35241 分钟前
复杂MapReduce作业设计:多阶段处理的最佳实践
大数据·hadoop
武子康3 小时前
大数据-100 Spark DStream 转换操作全面总结:map、reduceByKey 到 transform 的实战案例
大数据·后端·spark
expect7g5 小时前
Flink KeySelector
大数据·后端·flink
阿里云大数据AI技术20 小时前
StarRocks 助力数禾科技构建实时数仓:从数据孤岛到智能决策
大数据
Lx3521 天前
Hadoop数据处理优化:减少Shuffle阶段的性能损耗
大数据·hadoop
武子康1 天前
大数据-99 Spark Streaming 数据源全面总结:原理、应用 文件流、Socket、RDD队列流
大数据·后端·spark
阿里云大数据AI技术2 天前
大数据公有云市场第一,阿里云占比47%!
大数据
Lx3522 天前
Hadoop容错机制深度解析:保障作业稳定运行
大数据·hadoop
T06205142 天前
工具变量-5G试点城市DID数据(2014-2025年
大数据
向往鹰的翱翔2 天前
BKY莱德因:5大黑科技逆转时光
大数据·人工智能·科技·生活·健康医疗