大数据数仓建模中星型模型和雪花模型,你了解吗?

这两种模型描述的都是数仓建模中事实表和维度表之间的拆分关系;星型和雪花的形状相同的特点都是一个中心向四周辐射,中心点代表着事实表,向四周辐射的点代表维度表;这两种模型的不同点在于星型模型的维度只辐射一次,雪花模型的维度在辐射玩一次之后会再次向外辐射,也就是在维度表中再次拆分出新的维度。

数仓建模就是对事实表和维度表的设计,数据的本质还是事实数据;雪花模型就是在星型模型的基础上对已经提取出的维度表再次拆分后形成的表关系描述;现实情况中对于雪花模型的设计规范会更符合数据库的范式要求,但是由于数据的拆分粒度更细涉及到多表的关联从而导致数据的分析效率变低;而星型模型虽然维度表可能存在一定的数据冗余但是考虑到其数据分析的效率会更高;因此综合考虑下一般都是推荐使用星型模型。

相关推荐
笃行3506 小时前
金仓数据库数据安全双防线:静态存储加密与传输加密实战
数据库
笃行3506 小时前
金仓数据库物理备份实战:sys_rman 全流程演练与误覆盖抢救
数据库
笃行3506 小时前
金仓数据库逻辑备份实战:从全库导出到 Schema 替换的完整闭环
数据库
SelectDB1 天前
阶跃星辰基于 SelectDB 构建 PB 级 Agent 可观测平台
大数据·数据库·aigc
这个DBA有点耶1 天前
GROUP BY优化全解:如何写出既不丢数据又飞快的分组查询
数据库·mysql·架构
掉头发的王富贵1 天前
【StarRocks】极限十分钟入门StarRocks
数据库·sql·mysql
Nturmoils1 天前
WHERE 条件别凭习惯写,常用查询先跑一遍
数据库
Databend2 天前
在 AWS 中国峰会逛了一天,我在 Databend 展台看到了 Agent 数据基础设施的新思路
数据库·人工智能·agent
ClouGence3 天前
Oracle 数据同步为什么会出现数据不一致?长事务是常被忽略的原因
数据库·后端·oracle