数据仓库_维度表的两大分类

最近看一篇文章对维度表进行了分类,记录一下。

维度表主要分为两类高基数维度表和低基数维度表。

高基数维度数据

一般是用户资料表、商品资料表类似的资料表。数据量可能是千万级或者上亿级别。

低基数维度数据

一般是配置表,比如枚举值对应的中文含义,或者日期维度,地理维度表等。数据量可能是个位数或者几千条几万条。

基数指的是一个字段中不同值的个数,比如主键列具有唯一值,所以具有最高的基数,而性别枚举值(日期,地区等)这样的列的基数就很低。

相关推荐
陆水A9 小时前
数仓主题域划分
大数据·数据仓库·数据库开发·etl·etl工程师
随心............13 小时前
hive专题面试总结
数据仓库·hive
isNotNullX14 小时前
主数据管理系统能代替数据中台吗?
大数据·数据仓库·人工智能·数据分析·etl
liliangcsdn4 天前
mac测试ollama llamaindex
数据仓库·人工智能·prompt·llama
晴天彩虹雨4 天前
统一调度与编排:构建自动化数据驱动平台
大数据·运维·数据仓库·自动化·big data·etl
Sirius Wu4 天前
Hive的窗口函数
数据仓库·hive·hadoop
isNotNullX5 天前
数据集成难在哪?制造企业该怎么做?
大数据·数据库·数据仓库·人工智能·制造
Sirius Wu6 天前
一文说清楚Hive
数据仓库·hive·hadoop·后端
天翼云开发者社区6 天前
离线数仓优化简述
数据仓库
Leo.yuan7 天前
小白做投资测算,如何快速上手?
数据库·数据仓库·人工智能·算法·信息可视化