hive数据的导入导出

目录

分区表:

分桶表:

数据导出


普通表:
load data【 local 】 inpath ' 数据文件路径 ' [overwrite] into table 表名 ;
--overwrite into table 覆盖添加
-- intotable 追加

从linux本地导入数据到表中

sql 复制代码
load data local inpath '/home/test2/emp_data.txt' overwrite into table emp;

从HDFS上导入数据到表中

sql 复制代码
load data inpath '/emp_data.txt' overwrite into table emp;
分区表:

load data【 local 】 inpath ' 数据文件路径 ' [overwrite] into table 表名 partition ( 分区字段 =
值 );

sql 复制代码
load data local inpath '/home/test2/emp_data_Finance.txt' into table emp_partition
partition(dept_name='Finance');

若Finance分区存在,向分区中加载数据,若分区不存在,创建分区,并加载数据

sql 复制代码
select * from emp_partition where dept_name='Finance'; 

-- 开启动态分区开关
set hive.exec.dynamic.partition.mode=nonstrict;

sql 复制代码
insert overwrite table emp_partition partition(dept_name)
select * from emp_pt;
分桶表:

-- 开启分桶功能
set hive.enforce.bucketing=true;
-- 忽略掉安全检查
set hive.strict.checks.bucketing=false;

sql 复制代码
load data local inpath '/home/test2/emp_data_Sales.txt' overwrite into table emp_bucket;
数据导出
sql 复制代码
INSERT OVERWRITE LOCAL DIRECTORY '/home/test2'
ROW FORMAT DELIMITED FIELDS TERMINATED by '\t'
select * from emp_pt;
相关推荐
ClouderaHadoop8 小时前
CDH 最隐蔽的坑:NTP 时间同步导致的 5 类故障
hadoop·hbase·kerberos·cloudera·cdh
Gent_倪9 小时前
Hadoop生态组件介绍
大数据·hadoop
地球资源数据云10 小时前
1900-2023年中国物种分布点位矢量数据集
大数据·数据结构·数据库·数据仓库·人工智能
YaBingSec11 小时前
玄机网络安全靶场:Hadoop YARN ResourceManager 未授权 RCE WP
大数据·数据库·hadoop·redis·笔记·分布式·web安全
Leo.yuan12 小时前
数据仓库是什么?数据仓库和大数据平台、数据湖、数据中台、湖仓一体有什么区别?
大数据·数据仓库·spark
哥本哈士奇1 天前
数据仓库笔记 第六篇:PSA 层 SCD2 处理方式
数据仓库
曹牧1 天前
Java Web 开发:servlet-mapping‌
java·数据仓库·hive·hadoop
juniperhan1 天前
Flink 系列第20篇:Flink SQL 语法全解:从 DDL 到 DML,窗口、聚合、列转行一网打尽
大数据·数据仓库·分布式·sql·flink
菜鸟小码2 天前
HDFS 数据块(Block)机制深度解析:从原理到实战
大数据·hadoop·hdfs
早睡早起早日毕业2 天前
大数据管理与应用系列丛书《大数据平台架构》之第4章 Hadoop 分布式文件系统 (HDFS)
大数据·hadoop·架构