数据仓库_维度表的两大分类

最近看一篇文章对维度表进行了分类,记录一下。

维度表主要分为两类高基数维度表和低基数维度表。

高基数维度数据

一般是用户资料表、商品资料表类似的资料表。数据量可能是千万级或者上亿级别。

低基数维度数据

一般是配置表,比如枚举值对应的中文含义,或者日期维度,地理维度表等。数据量可能是个位数或者几千条几万条。

基数指的是一个字段中不同值的个数,比如主键列具有唯一值,所以具有最高的基数,而性别枚举值(日期,地区等)这样的列的基数就很低。

相关推荐
chad__chang17 小时前
HIVE的Window functions窗口函数【二】
数据仓库·hive·hadoop
秉寒-CHO18 小时前
5w2h构建数据仓库与sow
大数据·数据仓库
白日与明月1 天前
Hive中的with子句
数据仓库·hive
喻师傅4 天前
横扫SQL面试——流量与转化率分类
大数据·数据仓库·sql
不辉放弃4 天前
为什么hive在处理数据时,有的累加是半累加数据
数据仓库·hive·hadoop
Sirius Wu7 天前
大数据平台ETL任务导入分库分表数据
大数据·数据仓库·etl
没有梦想的咸鱼185-1037-16639 天前
SWMM排水管网水力、水质建模及在海绵与水环境中的应用
数据仓库·人工智能·数据挖掘·数据分析
派可数据BI可视化10 天前
解读商业智能BI,数据仓库中的元数据
大数据·数据仓库·数据分析·spark·商业智能bi
老刘聊集成10 天前
ETL 工具选型评测:2025 年 Top 5 工具优缺点对比(附评分表)
数据仓库·etl
越来越无动于衷10 天前
Spring Boot 整合 Spring MVC:自动配置与扩展实践
数据仓库·hive·hadoop