数据仓库_维度表的两大分类

最近看一篇文章对维度表进行了分类,记录一下。

维度表主要分为两类高基数维度表和低基数维度表。

高基数维度数据

一般是用户资料表、商品资料表类似的资料表。数据量可能是千万级或者上亿级别。

低基数维度数据

一般是配置表,比如枚举值对应的中文含义,或者日期维度,地理维度表等。数据量可能是个位数或者几千条几万条。

基数指的是一个字段中不同值的个数,比如主键列具有唯一值,所以具有最高的基数,而性别枚举值(日期,地区等)这样的列的基数就很低。

相关推荐
旺仔小拳头..12 分钟前
Servlet概念与创建
数据仓库·hive·hadoop
旺仔小拳头..2 小时前
Filter 过滤器 与Listener 监听器
数据仓库·hive·hadoop
Leo.yuan2 小时前
实时ETL怎么做?有哪些好用的ETL工具?
数据仓库·etl
AllData公司负责人3 小时前
AllData数据中台通过集成DolphinScheduler+Seatunnel实现SAP HANA数据库同步到Doris数据仓库
数据库·数据仓库·sap hana
`林中水滴`5 小时前
【数据仓库】Iceberg、Hudi、Delta Lake、Paimon:四大开源湖表格式怎么选?
数据仓库
黄昏回响5 小时前
计算机系统基础知识(补充篇):数据库——数据仓库、数据中台与大数据技术详解
大数据·数据库·数据仓库
淡定一生233319 小时前
数据仓库中的退化维度
数据仓库
smchaopiao1 天前
Hive中的排序与分桶技术详解
数据仓库·hive·hadoop
tsyjjOvO4 天前
SpringMVC 从入门到精通
数据仓库·hive·hadoop
weixin_449310844 天前
ETL转换和数据写入小满OKKICRM的技术细节
数据仓库·php·etl