尚硅谷大数据项目《在线教育之离线数仓》笔记005

视频地址:尚硅谷大数据项目《在线教育之离线数仓》_哔哩哔哩_bilibili

目录

[第10章 数仓开发之DWS层](#第10章 数仓开发之DWS层)

P071

P072

P073

P074

P075

P076

P077

P078

P079

P080

P081

P082

P083

P084

P085

P086


第10章 数仓开发之DWS层

P071

设计要点:

(1)DWS层的设计参考指标体系

(2)DWS层的数据存储格式为orc列式存储+snappy压缩。

(3)DWS层表名的命名规范为dws_数据域_统计粒度_业务过程_统计周期(1d/nd/td)。

注:1d标识最近1日,nd表示最近n日,td表示历史至今。

P072

10.1.1 交易域用户粒度用户加购最近1日汇总表

10.1.2 交易域用户粒度用户支付最近1日汇总表

P073

10.1.3 交易域会话粒度用户下单最近1日汇总表

P074

10.1.4 考试域试卷粒度考试最近1日汇总表

P075

10.1.5 考试域试卷分数段粒度最近1日汇总表

P076

10.1.6 考试域题目粒度考试最近1日汇总表

P077

10.1.7 流量域会话粒度页面浏览最近1日汇总表

P078

10.1.8 数据装载脚本

P079

10.2.1 交易域用户粒度用户加购最近n日汇总表

10.2.2 交易域用户粒度用户支付最近n日汇总表

P080

10.2.3 考试域试卷粒度考试最近n日汇总表

P081

10.2.4 考试域试卷分数段粒度最近n日汇总表

10.2.5 考试域题目粒度考试最近n日汇总表

P082

10.2.6 数据装载脚本

P083

10.3.1 交易域用户粒度下单历史至今汇总表

P084

10.3.2 交易域用户粒度用户支付历史至今汇总表

P085

10.3.3 用户域用户粒度用户登录历史至今汇总表

P086

10.3.4 数据装载脚本

相关推荐
Data 31742 分钟前
Hive数仓操作(十)
大数据·数据库·数据仓库·hive·hadoop
ON.LIN42 分钟前
Hadoop大数据入门——Hive-SQL语法大全
大数据·数据库·hive·hadoop·分布式·sql
Elastic 中国社区官方博客1 小时前
Elasticsearch 开放推理 API 增加了对 Google AI Studio 的支持
大数据·数据库·人工智能·elasticsearch·搜索引擎
cndes1 小时前
大数据算法的思维
大数据·算法·支持向量机
青云交2 小时前
大数据新视界 --大数据大厂之 Kafka 性能优化的进阶之道:应对海量数据的高效传输
大数据·数据库·人工智能·性能优化·kafka·数据压缩·分区策略·磁盘 i/o
奔跑吧邓邓子10 小时前
大数据利器Hadoop:从基础到实战,一篇文章掌握大数据处理精髓!
大数据·hadoop·分布式
说私域11 小时前
基于定制开发与2+1链动模式的商城小程序搭建策略
大数据·小程序
hengzhepa12 小时前
ElasticSearch备考 -- Async search
大数据·学习·elasticsearch·搜索引擎·es
GZ_TOGOGO13 小时前
【2024最新】华为HCIE认证考试流程
大数据·人工智能·网络协议·网络安全·华为
狼头长啸李树身15 小时前
眼儿媚·秋雨绵绵窗暗暗
大数据·网络·服务发现·媒体