数据仓库(3)-模型建设

本文从以下9个内容,介绍数据参考模型建设相关内容。

1、OLTP VS OLAP

OLTP:全称OnLine Transaction Processing,中文名联机事务处理系统,主要是执行基本日常的事务处理,比如数据库记录的增删查改,例如mysql、oracle

OLAP:全称OnLine Analytical Processing,中文名联机分析处理系统,支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果,例如、ClickHouse、Doris、Kylin

两者比较结果可见如下

2、数仓分层

通常我们吧数据分成4层,ODS、DWD、DWS、ADS。有时候业务在DWD和DWS中间放置一层轻度汇总层用于过渡。

3、数仓数据建模

什么是数据模型:数据特征的抽象,通常包括数据结构、数据操作、数据约束。

4、数据建模方法

数据建模方式很多,数据仓种最常见的是两种,维度建模和三范式建模(也叫实体关系建模)。以下详细介绍

5、数据建模流程

模型设计基本原则

维度建模设计大图

模型建设流程(详细)

总线矩阵

指以一致性维度为列,以业务过程为行,构建业务的数据矩阵,通过标记表示该维度与业务过程的相关性

模型建设5要素

模型设计中核心要考量的要素为5项:主题域 、事实表设计、维表设计、确认颗粒度、明确度量值。

相关推荐
浊酒南街9 小时前
hive中map_concat函数介绍
数据仓库·hive·hadoop
Java资深爱好者18 小时前
数据湖与数据仓库的区别
大数据·数据仓库·spark
zmd-zk2 天前
hive中windows子句的使用
大数据·数据仓库·hive·hadoop·windows·分布式·big data
字节数据平台2 天前
基于OLAP湖仓一体架构,火山引擎ByteHouse助力企业降本提效
数据仓库·火山引擎
isNotNullX2 天前
数据仓库还是数据集市?这俩怎么选?
大数据·数据仓库·分布式·etl
hamish-wu2 天前
Dolphinscheduler配置dataX离线采集任务写入hive实践(二)
数据仓库·hive·hadoop
朽木自雕,格物致知!3 天前
hive分区表
数据仓库·hive·hadoop
isNotNullX3 天前
数据网格能替代数据仓库吗?
大数据·数据库·数据仓库·etl·数据同步·数据网格
hamish-wu3 天前
dolphin 配置data 从文件导入hive 实践(一)
数据仓库·hive·hadoop
Yz98763 天前
Hive的远程模式
大数据·linux·数据仓库·hive·hadoop·分布式·big data