数据仓库_维度表的两大分类

最近看一篇文章对维度表进行了分类,记录一下。

维度表主要分为两类高基数维度表和低基数维度表。

高基数维度数据

一般是用户资料表、商品资料表类似的资料表。数据量可能是千万级或者上亿级别。

低基数维度数据

一般是配置表,比如枚举值对应的中文含义,或者日期维度,地理维度表等。数据量可能是个位数或者几千条几万条。

基数指的是一个字段中不同值的个数,比如主键列具有唯一值,所以具有最高的基数,而性别枚举值(日期,地区等)这样的列的基数就很低。

相关推荐
莫叫石榴姐1 小时前
SQL百题斩:从入门到精通,一站式解锁数据世界
大数据·数据仓库·sql·面试·职场和发展
lifallen10 小时前
从Apache Doris 学习 HyperLogLog
java·大数据·数据仓库·算法·apache
doll ~CJ11 小时前
数据仓库与数据挖掘基础知识
数据仓库·数据挖掘
数据要素X1 天前
寻梦数据空间 | 架构篇:从概念到落地的技术实践与突破性创新
大数据·运维·数据仓库·微服务·数据治理·数据中台·可信数据空间
呆呆小金人1 天前
SQL入门: HAVING用法全解析
大数据·数据库·数据仓库·sql·数据库开发·etl·etl工程师
一起喝芬达20101 天前
当数据仓库遇见AI:金融风控的「认知大脑」正在觉醒
数据仓库·人工智能
jianmin09202 天前
Python高效数据分析从入门到实战的七个步骤
数据仓库
卡拉叽里呱啦4 天前
Apache Iceberg介绍、原理与性能优化
大数据·数据仓库
AI悦创|编程1v17 天前
00-1-正则表达式学习心得:从入门到上瘾,再到克制
数据仓库·正则表达式·数据挖掘·ai悦创编程一对一教学·python一对一辅导·python一对一教学
DashingGuy7 天前
数仓各层级设计总结
数据仓库