数据总线/一致性维度/总线矩阵

数据孤岛

企业内部各个系统中的数据被隔离在不同的数据库中,无法进行共享和整合,严重影响了企业的决策能力和运营效率。

数据仓库数据总线

一种技术解决方案,旨在实现数据仓库与各个数据源之间的数据集成、交换和共享,通常做法是将所有的数据源连接到一条共享的数据总线上。

数据总线通过建立数据集成层,实现了不同数据源之间的数据传输和转换,从而打破数据孤岛,实现数据共享。

数据总线连接多个数据源,并将数据按照一定的规则进行清洗、转换和加工,提升数据质量和一致性,最终将数据加载到数据仓库中。

这样,企业就可以在数据仓库内部进行全面的数据分析和决策支持。

一致性维度

在同一个集市内,一致性维度的意思是两个维度如果有关系,要么就是完全一样的,要么就是一个维度在数学意义上是另一个维度的子集

维度保持一致后,事实就可以保存在各个数据集市中。虽然在物理上是独立的,但在逻辑上由一致性维度使所有的数据集市是联系在一起,随时可以进行交叉探察等操作,也就组成了数据仓库。

总结

总线矩阵:业务过程和维度的交点

一致性维度:同一集市的维度表,内容相同或包含

一致性事实:不同集市的同一事实,需保证口径一致,单位统一

参考

数据仓库数据总线

https://www.guandata.com/gy/post/12498.html

一篇文章搞懂数据仓库:总线架构、一致性维度、一致性事实

https://developer.aliyun.com/article/931916

相关推荐
地球资源数据云17 小时前
1900-2023年中国物种分布点位矢量数据集
大数据·数据结构·数据库·数据仓库·人工智能
Leo.yuan19 小时前
数据仓库是什么?数据仓库和大数据平台、数据湖、数据中台、湖仓一体有什么区别?
大数据·数据仓库·spark
哥本哈士奇2 天前
数据仓库笔记 第六篇:PSA 层 SCD2 处理方式
数据仓库
曹牧2 天前
Java Web 开发:servlet-mapping‌
java·数据仓库·hive·hadoop
juniperhan2 天前
Flink 系列第20篇:Flink SQL 语法全解:从 DDL 到 DML,窗口、聚合、列转行一网打尽
大数据·数据仓库·分布式·sql·flink
哥本哈士奇3 天前
数据仓库笔记 第五篇:Data Mart 层(数据集市)
数据仓库
juniperhan3 天前
Flink 系列第18篇:Flink 动态表、连续查询与 Changelog 机制
java·大数据·数据仓库·分布式·flink
juniperhan3 天前
Flink 系列第19篇:深入理解 Flink SQL 的时间语义与时区处理:从原理到实战
java·大数据·数据仓库·分布式·sql·flink
哥本哈士奇4 天前
数据仓库笔记 第三篇:常用缓慢变化维处理方式介绍
数据仓库
哥本哈士奇4 天前
数据仓库笔记 第一篇:数据仓库的定义、历史与意义
数据仓库