数据仓库的主流分层架构

数据仓库的分层架构主要是为了更好地组织和管理数据,以及优化数据处理和分析的效率。一般来说,数据仓库可以分为以下几个层次:

源数据层(Source Layer):也称为ODS(Operational Data Store)层 ,是数据仓库的最底层,主要存储原始的业务数据。这些数据通常直接从各个业务系统中抽取,不经过任何清洗或转换。
数据仓库明细层(Data Warehouse Detail, DWD) :这一层主要存储明细数据,即对源数据层的数据进行清洗、转换和加载后的结果。数据仓库明细层的数据应该是一致的、准确的、干净的数据,即去除了杂质的数据。
数据仓库汇总层(Data Warehouse Summary, DWS) :这一层主要存储汇总数据,即对DWD层的数据进行进一步的聚合和汇总。数据仓库汇总层的数据可以支持更高级别的数据分析和报表生成。
应用层(Application Layer):也称为数据应用层(Data Application Layer),是数据仓库的最顶层。这一层的数据主要面向具体的业务应用,如报表、专题分析、数据挖掘等。应用层的数据可以来自DWD层或DWS层,根据具体业务需求进行选择和组合。

除了以上四个层次外,有些数据仓库还会包含一个临时层(Temporary Layer),用于存储一些中间的计算结果或临时数据。这些临时数据在计算完成后通常会被删除,以节省存储空间。

通过分层架构的设计,数据仓库可以更好地满足不同的业务需求,提高数据处理和分析的效率,同时也方便数据的维护和管理。

相关推荐
pblh1239 分钟前
2023_Spark_实验十五:SparkSQL进阶操作
大数据·分布式·spark
给我整点护发素10 分钟前
Flink执行sql时报错
大数据·sql·flink
爱吃土豆的马铃薯ㅤㅤㅤㅤㅤㅤㅤㅤㅤ22 分钟前
Elasticsearch的查询语法——DSL 查询
大数据·elasticsearch·jenkins
Make_magic24 分钟前
Git学习教程(更新中)
大数据·人工智能·git·elasticsearch·计算机视觉
小周不摆烂38 分钟前
丹摩征文活动 | 丹摩智算平台:服务器虚拟化的璀璨明珠与实战秘籍
大数据·服务器
silver98861 小时前
分布式相关杂项
分布式
数据智研1 小时前
【数据分享】空间天气公报(2004-2021)(又名太阳数据活动公报) PDF
大数据·pdf
Elastic 中国社区官方博客2 小时前
使用真实 Elasticsearch 进行更快的集成测试
大数据·运维·服务器·数据库·elasticsearch·搜索引擎·集成测试
PcVue China6 小时前
PcVue + SQL Grid : 释放数据的无限潜力
大数据·服务器·数据库·sql·科技·安全·oracle
Mephisto.java7 小时前
【大数据学习 | HBASE】hbase的读数据流程与hbase读取数据
大数据·学习·hbase