大数据数仓建模中星型模型和雪花模型,你了解吗?

这两种模型描述的都是数仓建模中事实表和维度表之间的拆分关系;星型和雪花的形状相同的特点都是一个中心向四周辐射,中心点代表着事实表,向四周辐射的点代表维度表;这两种模型的不同点在于星型模型的维度只辐射一次,雪花模型的维度在辐射玩一次之后会再次向外辐射,也就是在维度表中再次拆分出新的维度。

数仓建模就是对事实表和维度表的设计,数据的本质还是事实数据;雪花模型就是在星型模型的基础上对已经提取出的维度表再次拆分后形成的表关系描述;现实情况中对于雪花模型的设计规范会更符合数据库的范式要求,但是由于数据的拆分粒度更细涉及到多表的关联从而导致数据的分析效率变低;而星型模型虽然维度表可能存在一定的数据冗余但是考虑到其数据分析的效率会更高;因此综合考虑下一般都是推荐使用星型模型。

相关推荐
先吃饱再说1 天前
存储的进化:从 MySQL 到浏览器缓存,数据到底住在哪?
数据库
Nturmoils1 天前
字段太多看不全,ksql 的展开模式和输出控制怎么用
数据库·后端
Databend1 天前
Agent 轨迹分析与归因的数据工程实践
大数据·数据库·agent
这个DBA有点耶1 天前
SQL改写进阶:标量子查询的“隐形代价”与消除实战
数据库·mysql·架构
smallyoung1 天前
数据库乐观锁深度解析:MySQL、PostgreSQL 实战 + Spring Boot 集成指南
数据库·mysql·postgresql
parade岁月1 天前
MySQL JOIN解析:朴实无华但食之有味
数据库·后端
用户3169353811831 天前
MySQL服务无法启动问题解决全记录
数据库
vivo互联网技术1 天前
从 10 分钟到 1 秒:ES 深度分页任意跳页的三轮优化实战
服务器·数据库·redis·elasticsearch·深度分页
倔强的石头_2 天前
《Kingbase护城河》——猎捕慢查询:执行计划的微观解析与索引调优实战
数据库
SelectDB2 天前
Apache Doris Python UDF:让 SQL 直接调用 Python 生态,支撑 Agent 时代复杂业务逻辑
大数据·数据库·python