数据仓库_维度表的两大分类

最近看一篇文章对维度表进行了分类,记录一下。

维度表主要分为两类高基数维度表和低基数维度表。

高基数维度数据

一般是用户资料表、商品资料表类似的资料表。数据量可能是千万级或者上亿级别。

低基数维度数据

一般是配置表,比如枚举值对应的中文含义,或者日期维度,地理维度表等。数据量可能是个位数或者几千条几万条。

基数指的是一个字段中不同值的个数,比如主键列具有唯一值,所以具有最高的基数,而性别枚举值(日期,地区等)这样的列的基数就很低。

相关推荐
梦里不知身是客112 小时前
hive中metastore 服务的意义
数据仓库·hive·hadoop
梦里不知身是客115 小时前
hive让分区关联数据的三种方式
数据仓库·hive·hadoop
jumu2021 天前
三菱FX5U与3台三菱E700变频器通讯实战
数据仓库
写代码的【黑咖啡】1 天前
数据仓库中保障数据质量的关键环节:任务发布后数据校验
数据仓库
m0_740043731 天前
Spring_全面详解入门
数据仓库·hive·hadoop
淡定一生23331 天前
数据仓库基本概念
大数据·数据仓库·spark
亲亲菱纱2 天前
20251202
数据仓库
SelectDB技术团队2 天前
面向 Agent 的高并发分析:Doris vs. Snowflake vs. ClickHouse
数据仓库·人工智能·科技·apache·知识图谱
德昂信息dataondemand2 天前
数据仓库性能优化:从模型到调度的系统性实践
数据仓库·性能优化
天天向上杰2 天前
小聊:银行数据仓库项目中 DEV → SIT → UAT → PRE-PROD → PROD
数据仓库