大数据数仓建模中星型模型和雪花模型,你了解吗?

这两种模型描述的都是数仓建模中事实表和维度表之间的拆分关系;星型和雪花的形状相同的特点都是一个中心向四周辐射,中心点代表着事实表,向四周辐射的点代表维度表;这两种模型的不同点在于星型模型的维度只辐射一次,雪花模型的维度在辐射玩一次之后会再次向外辐射,也就是在维度表中再次拆分出新的维度。

数仓建模就是对事实表和维度表的设计,数据的本质还是事实数据;雪花模型就是在星型模型的基础上对已经提取出的维度表再次拆分后形成的表关系描述;现实情况中对于雪花模型的设计规范会更符合数据库的范式要求,但是由于数据的拆分粒度更细涉及到多表的关联从而导致数据的分析效率变低;而星型模型虽然维度表可能存在一定的数据冗余但是考虑到其数据分析的效率会更高;因此综合考虑下一般都是推荐使用星型模型。

相关推荐
Flynt39 分钟前
Room 3.0 包名重构 + KMP 迁移:我把项目升级踩了个遍
android·数据库·kotlin
这个DBA有点耶17 小时前
NULL不是空——数据库里最反直觉的设计,90%新人踩过的坑
数据库·mysql·代码规范
这个DBA有点耶19 小时前
AI写的SQL跑崩了生产库,这锅谁背?
数据库·人工智能·程序员
镜舟科技19 小时前
Databricks 再提 LTAP,AI 时代的数据底座为何重回大一统叙事?
数据库·架构·agent
Databend20 小时前
从湖仓升级为 Agent 时代的数据控制面,Snowflake 和 Databricks 有哪些布局
大数据·数据库·agent
ClouGence1 天前
SQL Server CDC 能放到 Always On 备库读吗?一文讲透原理与实践
数据库·sql server
先吃饱再说2 天前
存储的进化:从 MySQL 到浏览器缓存,数据到底住在哪?
数据库
Nturmoils2 天前
字段太多看不全,ksql 的展开模式和输出控制怎么用
数据库·后端
Databend2 天前
Agent 轨迹分析与归因的数据工程实践
大数据·数据库·agent
这个DBA有点耶2 天前
SQL改写进阶:标量子查询的“隐形代价”与消除实战
数据库·mysql·架构