数据仓库_维度表的两大分类

最近看一篇文章对维度表进行了分类,记录一下。

维度表主要分为两类高基数维度表和低基数维度表。

高基数维度数据

一般是用户资料表、商品资料表类似的资料表。数据量可能是千万级或者上亿级别。

低基数维度数据

一般是配置表,比如枚举值对应的中文含义,或者日期维度,地理维度表等。数据量可能是个位数或者几千条几万条。

基数指的是一个字段中不同值的个数,比如主键列具有唯一值,所以具有最高的基数,而性别枚举值(日期,地区等)这样的列的基数就很低。

相关推荐
干就完事了1 天前
Hive视图
数据仓库·hive·hadoop
A尘埃1 天前
Hive基于Hadoop的数据仓库工具
数据仓库·hive·hadoop
杂家2 天前
Hive on Spark && Spark on Hive配置
大数据·数据仓库·hive·hadoop·spark
智海观潮4 天前
Hive经典面试题之连续登录、行转列和列转行
数据仓库·hive·hadoop
泰克教育官方账号4 天前
泰涨知识 | 10分钟快速入门Hive之基本操作篇
数据仓库·hive·hadoop
Dragon online5 天前
数据仓库深度探索系列:数仓建设全流程解析
数据仓库
isNotNullX5 天前
数据中台有什么用?数据仓库和数据中台怎么选?
大数据·数据仓库·人工智能·数据中台
martian6655 天前
第九章:如何学习和掌握BI?
大数据·数据仓库·学习·etl·bi
isNotNullX8 天前
怎么理解ETL增量抽取?
数据库·数据仓库·etl·企业数字化
叡鳍8 天前
Hive---案例7-6 列转行
数据仓库·hive·hadoop