大数据数仓建模中星型模型和雪花模型,你了解吗?

这两种模型描述的都是数仓建模中事实表和维度表之间的拆分关系;星型和雪花的形状相同的特点都是一个中心向四周辐射,中心点代表着事实表,向四周辐射的点代表维度表;这两种模型的不同点在于星型模型的维度只辐射一次,雪花模型的维度在辐射玩一次之后会再次向外辐射,也就是在维度表中再次拆分出新的维度。

数仓建模就是对事实表和维度表的设计,数据的本质还是事实数据;雪花模型就是在星型模型的基础上对已经提取出的维度表再次拆分后形成的表关系描述;现实情况中对于雪花模型的设计规范会更符合数据库的范式要求,但是由于数据的拆分粒度更细涉及到多表的关联从而导致数据的分析效率变低;而星型模型虽然维度表可能存在一定的数据冗余但是考虑到其数据分析的效率会更高;因此综合考虑下一般都是推荐使用星型模型。

相关推荐
小白教程32 分钟前
解读和分析mysql性能数据时,如何确定性能瓶颈的具体位置?
数据库·mysql·mysql教程·mysql优化教程
LaughingZhu39 分钟前
PH热榜 | 2025-04-26
前端·数据库·人工智能·mysql·开源
noravinsc3 小时前
django admin AttributeError: ‘UserResorce‘ object has no attribute ‘ID‘
数据库·django·sqlite
王有品5 小时前
Spring MVC 多个拦截器的执行顺序
数据库·spring·mvc
极小狐6 小时前
如何使用极狐GitLab 的外部状态检查功能?
数据库·ci/cd·gitlab·devops·mcp
Leo.yuan6 小时前
数据仓库建设全解析!
大数据·数据库·数据仓库·数据分析·spark
闪电麦坤956 小时前
SQL:子查询(subqueries)
数据库·sql
活跃的煤矿打工人6 小时前
【星海出品】分布式存储数据库etcd
数据库·分布式·etcd
文牧之6 小时前
PostgreSQL的扩展 pgcrypto
运维·数据库·postgresql
老友@8 小时前
小集合 VS 大集合:MySQL 去重计数性能优化
数据库·mysql·性能优化