技术栈
分桶
BabyFish13
5 天前
数据仓库
·
hive
·
hadoop
·
分区
·
分桶
Hive分区再分桶表
在Hive中,数据通常是根据分区(partition)来组织的,但是对于大数据集,单层分区可能不够用,因此可以进一步细分为桶(bucket)。桶可以用于提供额外的并行处理和优化查询性能。 在这种情况下,数据首先根据分区键进行分区,然后在每个分区内进行分桶。