Hive分桶表

分桶表

一、准备数据

markdown 复制代码
1,wsq1
2,wsq2
3,wsq3
4,wsq4
5,wsq5

二、开启分桶表的支持

sql 复制代码
set hive.enforce.bucketing=true;
set mapreduce.job.reduces=4;
set mapreduce.reduce.task=4;

三、创建分桶表

sql 复制代码
hive>create table bucketed_users(id int,name string) clustered by (id) sorted by (id) into 4 buckets row format delimited fields terminated by ',';

四、创建存放数据的表并将原数据加载入

sql 复制代码
hive> create table users(id int,name string) row format delimited fields terminated by ',';
hive> load data local inpath '/home/ec2-user/total/wsq' into table users;

五、数据装载到分桶表

sql 复制代码
hive> insert into bucketed_users select * from users;
相关推荐
一只小青团1 小时前
Hadoop之javaAPI写HDFS的shell命令
大数据·hadoop·分布式
泰克教育官方账号1 小时前
泰涨知识 | 10分钟快速入门Hive之基本操作篇
数据仓库·hive·hadoop
howard20051 小时前
5.5 Hive导出数据实战
hive·导出数据
howard20051 小时前
5.3 Hive更新数据实战
hive·数据更新·事务表
Just_Do_IT_OK6 小时前
Docker--Apache/hadoop
hadoop·docker·apache
Dragon online19 小时前
数据仓库深度探索系列:数仓建设全流程解析
数据仓库
isNotNullX20 小时前
数据中台有什么用?数据仓库和数据中台怎么选?
大数据·数据仓库·人工智能·数据中台
稚辉君.MCA_P8_Java21 小时前
通义千问 SpringBoot 性能优化全景设计(面向 Java 开发者)
大数据·hadoop·spring boot·分布式·架构
沧海寄馀生21 小时前
Apache Hadoop生态组件部署分享-zookeeper
hadoop·zookeeper·eclipse·apache·java-zookeeper
百度Geek说1 天前
百度大数据成本治理实践
hadoop·spark