最近看一篇文章对维度表进行了分类,记录一下。
维度表主要分为两类高基数维度表和低基数维度表。
高基数维度数据
一般是用户资料表、商品资料表类似的资料表。数据量可能是千万级或者上亿级别。
低基数维度数据
一般是配置表,比如枚举值对应的中文含义,或者日期维度,地理维度表等。数据量可能是个位数或者几千条几万条。
基数指的是一个字段中不同值的个数,比如主键列具有唯一值,所以具有最高的基数,而性别枚举值(日期,地区等)这样的列的基数就很低。
最近看一篇文章对维度表进行了分类,记录一下。
维度表主要分为两类高基数维度表和低基数维度表。
一般是用户资料表、商品资料表类似的资料表。数据量可能是千万级或者上亿级别。
一般是配置表,比如枚举值对应的中文含义,或者日期维度,地理维度表等。数据量可能是个位数或者几千条几万条。
基数指的是一个字段中不同值的个数,比如主键列具有唯一值,所以具有最高的基数,而性别枚举值(日期,地区等)这样的列的基数就很低。