数据总线/一致性维度/总线矩阵

数据孤岛

企业内部各个系统中的数据被隔离在不同的数据库中,无法进行共享和整合,严重影响了企业的决策能力和运营效率。

数据仓库数据总线

一种技术解决方案,旨在实现数据仓库与各个数据源之间的数据集成、交换和共享,通常做法是将所有的数据源连接到一条共享的数据总线上。

数据总线通过建立数据集成层,实现了不同数据源之间的数据传输和转换,从而打破数据孤岛,实现数据共享。

数据总线连接多个数据源,并将数据按照一定的规则进行清洗、转换和加工,提升数据质量和一致性,最终将数据加载到数据仓库中。

这样,企业就可以在数据仓库内部进行全面的数据分析和决策支持。

一致性维度

在同一个集市内,一致性维度的意思是两个维度如果有关系,要么就是完全一样的,要么就是一个维度在数学意义上是另一个维度的子集

维度保持一致后,事实就可以保存在各个数据集市中。虽然在物理上是独立的,但在逻辑上由一致性维度使所有的数据集市是联系在一起,随时可以进行交叉探察等操作,也就组成了数据仓库。

总结

总线矩阵:业务过程和维度的交点

一致性维度:同一集市的维度表,内容相同或包含

一致性事实:不同集市的同一事实,需保证口径一致,单位统一

参考

数据仓库数据总线

https://www.guandata.com/gy/post/12498.html

一篇文章搞懂数据仓库:总线架构、一致性维度、一致性事实

https://developer.aliyun.com/article/931916

相关推荐
bigdata-rookie14 小时前
Starrocks 简介
大数据·数据库·数据仓库
普通网友15 小时前
Hive ACID 事务表实战:插入 / 更新 / 删除操作的配置与使用限制
数据仓库·hive·hadoop
独自归家的兔15 小时前
windows Hive使用全攻略:从入门到实战,轻松搞定大数据处理 - Hadoop windows安装
数据仓库·hive·hadoop
走过冬季15 小时前
02 | Hive SMB Join 原理
数据仓库·hive·hadoop
talle20211 天前
Hive | 行列转换
数据仓库·hive·hadoop
Gain_chance2 天前
27-学习笔记尚硅谷数仓搭建-数据仓库DWD层介绍及其事务表(行为)相关概念
大数据·数据仓库·笔记·学习
CTO Plus技术服务中2 天前
Hive开发与运维教程
数据仓库·hive·hadoop
Gain_chance2 天前
28-学习笔记尚硅谷数仓搭建-DWD层交易域加购事务事实表建表语句及详细分析
数据仓库·hive·笔记·学习·datagrip
小邓睡不饱耶2 天前
Hive 实战:数据仓库建模、SQL 进阶与企业级案例
数据仓库·hive·sql
得物技术2 天前
从“人治”到“机治”:得物离线数仓发布流水线质量门禁实践
大数据·数据仓库