【数据仓库】主题域和数据域

数据域与主题域区别

https://www.cnblogs.com/datadance/p/16898254.html

  • 数据域是自下而上,以业务数据视角来划分数据,一般进行完业务系统数据调研之后就可以进行数据域的划分。针对公共明细层(DWD)进行主题划分。
  • 主题域则自上而下,以业务分析视角来划分数据,一般进行完业务需求调研之后才可以进行主题域的划分。针对公共汇总层(DWS)进行数据域划分。

举个更形象点的例子,建设数仓就像饭店做菜一样,数仓在面向业务系统数据根据其特点划分出数据域,如同厨房根据采购的食材特点将它们摆放在不同货架区,如肉禽区、果蔬区、调味区等。而数仓在面向业务分析根据其需求划分出主题域,如同饭店根据不同食客群体的口味需求将食材做成了不同菜系,如江浙菜、鲁菜、川菜等。

对于数据仓库的定义是这样的,它是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策。

相关推荐
RestCloud36 分钟前
如何借助ETL数据集成工具实现数据一致性?
数据仓库·api·etl·数字化转型·数据转换·数据抽取·集成平台
随缘而动,随遇而安37 分钟前
第五十二篇 浅谈ETL系统设计
大数据·数据仓库·数据分析·数据库开发·数据库架构
猫头虎1 小时前
浅谈国产数据库多租户方案:提升云计算与SaaS的资源管理效率
大数据·数据库·数据仓库·sql·云计算·时序数据库·kingbasees
晴天彩虹雨13 小时前
实时数仓体系概览与架构演进
数据仓库·clickhouse·架构·flink·kafka
骇客野人1 天前
数据仓库ODS、DWD、DWS、ADS各层介绍
数据仓库
白-胖-子2 天前
快速认识:数据库、数仓(数据仓库)、数据湖与数据运河
大数据·linux·数据库·数据仓库·人工智能
RestCloud2 天前
2025年五大ETL数据集成工具推荐
数据仓库·etl·数字化转型·数据集成·数据集成平台·informatica·talend
D愿你归来仍是少年2 天前
使用 PySpark 批量清理 Hive 表历史分区
大数据·数据仓库·hive·spark
chat2tomorrow3 天前
数据仓库 vs 数据湖:架构、应用场景与技术差异全解析
大数据·数据仓库·低代码·架构·数据湖·sql2api
不剪发的Tony老师3 天前
StarRocks:一款开源的高性能分析型数据仓库
starrocks·数据仓库