数据仓库_维度表的两大分类

最近看一篇文章对维度表进行了分类,记录一下。

维度表主要分为两类高基数维度表和低基数维度表。

高基数维度数据

一般是用户资料表、商品资料表类似的资料表。数据量可能是千万级或者上亿级别。

低基数维度数据

一般是配置表,比如枚举值对应的中文含义,或者日期维度,地理维度表等。数据量可能是个位数或者几千条几万条。

基数指的是一个字段中不同值的个数,比如主键列具有唯一值,所以具有最高的基数,而性别枚举值(日期,地区等)这样的列的基数就很低。

相关推荐
RestCloud16 小时前
产品更新丨谷云科技 iPaaS 集成平台 V7.5 版本发布
数据仓库·系统安全·api·数字化转型·ipaas·数据集成平台·集成平台
RestCloud16 小时前
数据清洗(ETL/ELT)原理与工具选择指南:企业数字化转型的核心引擎
数据仓库·数据安全·etl·数据集成·elt·集成平台
wingaso18 小时前
[经验总结]删除gitlab仓库分支报错:错误:无法推送一些引用到“http:”
linux·数据仓库·git
RestCloud2 天前
企业对数据集成工具的需求及 ETL 工具工作原理详解
数据仓库·系统安全·etl·数字化转型·数据集成平台·集成平台
朵朵zeng3 天前
ETL背景介绍_1:数据孤岛仓库的介绍
数据仓库·etl·原型模式
方二华3 天前
数据仓库:企业数据管理的核心引擎
数据仓库
IvanCodes4 天前
七、深入 Hive DDL:管理表、分区与洞察元数据
数据仓库·hive·hadoop
RestCloud4 天前
ETL 数据集成平台与数据仓库的关系及 ETL 工具推荐
数据仓库·etl·cdc·数据集成平台
yyf9601265 天前
hiveserver2与beeline进行远程连接hive配置及遇到的问题
数据仓库·hive
jiedaodezhuti5 天前
hive两个表不同数据类型字段关联引发的数据倾斜
数据仓库·hive·hadoop