hive数据的导入导出

目录

分区表:

分桶表:

数据导出


普通表:
load data【 local 】 inpath ' 数据文件路径 ' [overwrite] into table 表名 ;
--overwrite into table 覆盖添加
-- intotable 追加

从linux本地导入数据到表中

sql 复制代码
load data local inpath '/home/test2/emp_data.txt' overwrite into table emp;

从HDFS上导入数据到表中

sql 复制代码
load data inpath '/emp_data.txt' overwrite into table emp;
分区表:

load data【 local 】 inpath ' 数据文件路径 ' [overwrite] into table 表名 partition ( 分区字段 =
值 );

sql 复制代码
load data local inpath '/home/test2/emp_data_Finance.txt' into table emp_partition
partition(dept_name='Finance');

若Finance分区存在,向分区中加载数据,若分区不存在,创建分区,并加载数据

sql 复制代码
select * from emp_partition where dept_name='Finance'; 

-- 开启动态分区开关
set hive.exec.dynamic.partition.mode=nonstrict;

sql 复制代码
insert overwrite table emp_partition partition(dept_name)
select * from emp_pt;
分桶表:

-- 开启分桶功能
set hive.enforce.bucketing=true;
-- 忽略掉安全检查
set hive.strict.checks.bucketing=false;

sql 复制代码
load data local inpath '/home/test2/emp_data_Sales.txt' overwrite into table emp_bucket;
数据导出
sql 复制代码
INSERT OVERWRITE LOCAL DIRECTORY '/home/test2'
ROW FORMAT DELIMITED FIELDS TERMINATED by '\t'
select * from emp_pt;
相关推荐
xerthwis3 小时前
Hadoop:大数据世界的“古老基石”与“沉默的共生者”
大数据·人工智能·hadoop
yumgpkpm5 小时前
Cloudera CDH5|CDH6|CDP7.1.7|CDP7.3|CMP 7.3的产品优势分析(在华为鲲鹏 ARM 麒麟KylinOS、统信UOS)
大数据·人工智能·hadoop·深度学习·spark·transformer·cloudera
ghgxm5205 小时前
EXCEL使用VBA代码实现按条件查询数据库--简单实用
开发语言·数据仓库·笔记·excel·数据库开发
yumgpkpm6 小时前
Hadoop如何用Flink支持实时数据分析需求
大数据·hadoop·分布式·hdfs·flink·kafka·cloudera
喻师傅1 天前
Hive 中 NULL 值在逻辑判断中的“陷阱”(踩坑复盘)
数据仓库·hive·hadoop
涤生大数据1 天前
放弃Canal后,我们用Flink CDC实现了99.99%的数据一致性
大数据·数据仓库·flink·大数据开发·flink cdc·数据开发·实时数据
jinxinyuuuus2 天前
订阅指挥中心:数据可移植性、Schema设计与用户数据主权
数据仓库·人工智能
老徐电商数据笔记2 天前
技术复盘第四篇:Kimball维度建模在电商场景的实战应用
大数据·数据仓库·技术面试
LF3_2 天前
Centos7,单机搭建Hadoop3.3.6伪分布式集群
大数据·hadoop·伪分布式
程序员小羊!3 天前
数仓数据基线,在不借助平台下要怎么做?
大数据·数据仓库