【数据仓库】主题域和数据域

数据域与主题域区别

https://www.cnblogs.com/datadance/p/16898254.html

  • 数据域是自下而上,以业务数据视角来划分数据,一般进行完业务系统数据调研之后就可以进行数据域的划分。针对公共明细层(DWD)进行主题划分。
  • 主题域则自上而下,以业务分析视角来划分数据,一般进行完业务需求调研之后才可以进行主题域的划分。针对公共汇总层(DWS)进行数据域划分。

举个更形象点的例子,建设数仓就像饭店做菜一样,数仓在面向业务系统数据根据其特点划分出数据域,如同厨房根据采购的食材特点将它们摆放在不同货架区,如肉禽区、果蔬区、调味区等。而数仓在面向业务分析根据其需求划分出主题域,如同饭店根据不同食客群体的口味需求将食材做成了不同菜系,如江浙菜、鲁菜、川菜等。

对于数据仓库的定义是这样的,它是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策。

相关推荐
RestCloud19 小时前
TiDB 混合负载场景下的 ETL 与 CDC 实践
数据仓库·tidb·etl·cdc·数据同步·数据库传输
AllData公司负责人2 天前
AllData数据中台通过开源项目RustFS建设现代数据湖存储,接入工业, 医疗, 物联网数据,包括文件/图像/音频/视频数据!
数据库·数据仓库·物联网·开源·数据存储·数据接入·rustfs
juniperhan2 天前
Flink 系列第14篇:Flink Metrics 监控指标详解(生产环境版)
大数据·数据仓库·分布式·flink
菜鸟小码2 天前
深入理解 Hive 数据模型
数据仓库·hive·hadoop
菜鸟小码2 天前
Hive环境搭建与配置优化
数据仓库·hive·hadoop
xiaogai_gai3 天前
金蝶云星空API接口的ETL转换与数据写入方案
数据仓库·etl
菜鸟小码3 天前
Hive数据类型全解析:从基础到复杂类型实战指南
数据仓库·hive·hadoop
Gauss松鼠会3 天前
【GaussDB】浅谈SQL与ETL
数据库·数据仓库·sql·etl·gaussdb·经验总结
juniperhan3 天前
Flink 系列第13篇:Flink 生产环境中的并行度与资源配置
java·大数据·数据仓库·分布式·flink
菜鸟小码3 天前
深入浅出 Hive 数据类型:从入门到实战
数据仓库·hive·hadoop