hive数据的导入导出

目录

分区表:

分桶表:

数据导出


普通表:
load data【 local 】 inpath ' 数据文件路径 ' [overwrite] into table 表名 ;
--overwrite into table 覆盖添加
-- intotable 追加

从linux本地导入数据到表中

sql 复制代码
load data local inpath '/home/test2/emp_data.txt' overwrite into table emp;

从HDFS上导入数据到表中

sql 复制代码
load data inpath '/emp_data.txt' overwrite into table emp;
分区表:

load data【 local 】 inpath ' 数据文件路径 ' [overwrite] into table 表名 partition ( 分区字段 =
值 );

sql 复制代码
load data local inpath '/home/test2/emp_data_Finance.txt' into table emp_partition
partition(dept_name='Finance');

若Finance分区存在,向分区中加载数据,若分区不存在,创建分区,并加载数据

sql 复制代码
select * from emp_partition where dept_name='Finance'; 

-- 开启动态分区开关
set hive.exec.dynamic.partition.mode=nonstrict;

sql 复制代码
insert overwrite table emp_partition partition(dept_name)
select * from emp_pt;
分桶表:

-- 开启分桶功能
set hive.enforce.bucketing=true;
-- 忽略掉安全检查
set hive.strict.checks.bucketing=false;

sql 复制代码
load data local inpath '/home/test2/emp_data_Sales.txt' overwrite into table emp_bucket;
数据导出
sql 复制代码
INSERT OVERWRITE LOCAL DIRECTORY '/home/test2'
ROW FORMAT DELIMITED FIELDS TERMINATED by '\t'
select * from emp_pt;
相关推荐
3分钟秒懂大数据7 小时前
实时数仓实战篇一:长周期去重指标建设
大数据·数据仓库·面试·性能优化·flink
蓝眸少年CY7 小时前
什么是Hadoop
大数据·hadoop·分布式
zhixingheyi_tian8 小时前
Yarn 之 numa-awareness
hadoop
白日与明月8 小时前
Hive 中 UNION 与 UNION ALL
hive
白日与明月10 小时前
Hive 大表 Join 优化:从策略选择到倾斜处理
数据仓库·hive·hadoop
Java程序员威哥11 小时前
SpringBoot2.x与3.x自动配置注册差异深度解析:从原理到迁移实战
java·大数据·开发语言·hive·hadoop·spring boot·后端
【赫兹威客】浩哥13 小时前
【赫兹威客】Hadoop完全分布式克隆文件部署教程
大数据·hadoop·分布式
王九思13 小时前
SQL网关 Kyuubi 系列——基本介绍
数据仓库·hive·hadoop·sql·spark
白日与明月15 小时前
面试备考-Hive窗口函数
hive·面试·职场和发展
白日与明月15 小时前
Hive中的大批量关键词匹配场景优化
数据仓库·hive·hadoop