数据仓库_维度表的两大分类

最近看一篇文章对维度表进行了分类,记录一下。

维度表主要分为两类高基数维度表和低基数维度表。

高基数维度数据

一般是用户资料表、商品资料表类似的资料表。数据量可能是千万级或者上亿级别。

低基数维度数据

一般是配置表,比如枚举值对应的中文含义,或者日期维度,地理维度表等。数据量可能是个位数或者几千条几万条。

基数指的是一个字段中不同值的个数,比如主键列具有唯一值,所以具有最高的基数,而性别枚举值(日期,地区等)这样的列的基数就很低。

相关推荐
武子康1 天前
大数据-257 离线数仓 - 数据质量监控 监控方法 Griffin架构
java·大数据·数据仓库·hive·hadoop·后端
ProtonBase1 天前
如何从 0 到 1 ,打造全新一代分布式数据架构
java·网络·数据库·数据仓库·分布式·云原生·架构
csding112 天前
写入hive metastore报问题Permission denied: user=hadoop,inode=“/user/hive”
数据仓库·hive·hadoop
不会写代码的女程序猿3 天前
关于ETL的两种架构(ETL架构和ELT架构)
数据仓库·架构·etl
ssxueyi3 天前
数据仓库有哪些?
大数据·数据仓库·数据湖
武子康3 天前
大数据-256 离线数仓 - Atlas 数据仓库元数据管理 正式安装 启动服务访问 Hive血缘关系导入
大数据·数据仓库·hive·hadoop
向阳逐梦3 天前
开源云原生数据仓库ByConity ELT 的测试体验
数据仓库·云原生·开源
ssxueyi3 天前
数据仓库是什么?数据仓库简介
数据仓库
小刘鸭!4 天前
Hive解决数据倾斜
数据仓库·hive·hadoop
武子康4 天前
大数据-255 离线数仓 - Atlas 数据仓库元数据管理 数据血缘关系 元数据
大数据·数据仓库·hive·hadoop·spring