数据仓库_维度表的两大分类

最近看一篇文章对维度表进行了分类,记录一下。

维度表主要分为两类高基数维度表和低基数维度表。

高基数维度数据

一般是用户资料表、商品资料表类似的资料表。数据量可能是千万级或者上亿级别。

低基数维度数据

一般是配置表,比如枚举值对应的中文含义,或者日期维度,地理维度表等。数据量可能是个位数或者几千条几万条。

基数指的是一个字段中不同值的个数,比如主键列具有唯一值,所以具有最高的基数,而性别枚举值(日期,地区等)这样的列的基数就很低。

相关推荐
想做富婆15 小时前
Hive:窗口函数[ntile, first_value,row_number() ,rank(),dens_rank()]和自定义函数
数据仓库·hive·hadoop
weixin_307779133 天前
设计转换Apache Hive的HQL语句为Snowflake SQL语句的Python程序方法
数据仓库·hive·python·sql
想做富婆3 天前
Hive:窗口函数(1)
数据仓库·hive·hadoop
weixin_307779133 天前
本地Apache Hive的Linux服务器集群复制数据到SQL Server数据库的分步流程
数据库·数据仓库·hive·sqlserver
weixin_307779133 天前
在AWS上使用KMS客户端密钥加密S3文件,同时支持PySpark读写和Snowflake导入
大数据·数据仓库·python·spark·云计算
想做富婆4 天前
Hive:复杂数据类型之Map函数
数据仓库·hive·hadoop
想做富婆4 天前
Hive:struct数据类型,内置函数(日期,字符串,类型转换,数学)
数据仓库·hive·hadoop
想做富婆4 天前
Hive:基本查询语法
数据仓库·hive·hadoop
STONE_KKK5 天前
Hive详细讲解-各类函数速通
数据仓库·hive·hadoop
STONE_KKK5 天前
Hive详细讲解-调优分区表速通
数据仓库·hive·hadoop