Hive分桶表

分桶表

一、准备数据

markdown 复制代码
1,wsq1
2,wsq2
3,wsq3
4,wsq4
5,wsq5

二、开启分桶表的支持

sql 复制代码
set hive.enforce.bucketing=true;
set mapreduce.job.reduces=4;
set mapreduce.reduce.task=4;

三、创建分桶表

sql 复制代码
hive>create table bucketed_users(id int,name string) clustered by (id) sorted by (id) into 4 buckets row format delimited fields terminated by ',';

四、创建存放数据的表并将原数据加载入

sql 复制代码
hive> create table users(id int,name string) row format delimited fields terminated by ',';
hive> load data local inpath '/home/ec2-user/total/wsq' into table users;

五、数据装载到分桶表

sql 复制代码
hive> insert into bucketed_users select * from users;
相关推荐
TTBIGDATA3 小时前
【Knox编译】webhdfs-test 依赖收敛冲突问题处理
大数据·hadoop·ambari·hdp·kerberos·knox·bigtop
Databend6 小时前
Databend 2025:海量数据 × AI 一体化底座,v1.3 即将发布
大数据·数据仓库
心止水j7 小时前
hive问题
数据仓库·hive·hadoop
心止水j8 小时前
hive桶
数据仓库·hive·hadoop
心止水j8 小时前
hive 分区总结
数据仓库·hive·hadoop
走遍西兰花.jpg9 小时前
在hive中实现拉链表的更新和merge into
数据仓库·hive·hadoop
zgl_200537799 小时前
ZGLanguage 解析SQL数据血缘 之 提取子查询语句中的源表名
大数据·数据库·数据仓库·hive·hadoop·sql·etl
qq_12498707539 小时前
基于Hadoop的黑龙江旅游景点推荐系统的设计与实现(源码+论文+部署+安装)
大数据·hadoop·分布式·python·信息可视化
laocooon52385788610 小时前
大专Hadoop课程考试方案设计
大数据·hadoop·分布式
是阿威啊10 小时前
【用户行为归因分析项目】- 【企业级项目开发第五站】数据采集并加载到hive表
大数据·数据仓库·hive·hadoop·spark·scala