hive数据的导入导出

目录

分区表:

分桶表:

数据导出


普通表:
load data【 local 】 inpath ' 数据文件路径 ' [overwrite] into table 表名 ;
--overwrite into table 覆盖添加
-- intotable 追加

从linux本地导入数据到表中

sql 复制代码
load data local inpath '/home/test2/emp_data.txt' overwrite into table emp;

从HDFS上导入数据到表中

sql 复制代码
load data inpath '/emp_data.txt' overwrite into table emp;
分区表:

load data【 local 】 inpath ' 数据文件路径 ' [overwrite] into table 表名 partition ( 分区字段 =
值 );

sql 复制代码
load data local inpath '/home/test2/emp_data_Finance.txt' into table emp_partition
partition(dept_name='Finance');

若Finance分区存在,向分区中加载数据,若分区不存在,创建分区,并加载数据

sql 复制代码
select * from emp_partition where dept_name='Finance'; 

-- 开启动态分区开关
set hive.exec.dynamic.partition.mode=nonstrict;

sql 复制代码
insert overwrite table emp_partition partition(dept_name)
select * from emp_pt;
分桶表:

-- 开启分桶功能
set hive.enforce.bucketing=true;
-- 忽略掉安全检查
set hive.strict.checks.bucketing=false;

sql 复制代码
load data local inpath '/home/test2/emp_data_Sales.txt' overwrite into table emp_bucket;
数据导出
sql 复制代码
INSERT OVERWRITE LOCAL DIRECTORY '/home/test2'
ROW FORMAT DELIMITED FIELDS TERMINATED by '\t'
select * from emp_pt;
相关推荐
麦聪聊数据36 分钟前
企业数据流通与敏捷API交付实战(一):ETL、CDC与API调用对比
数据库·数据仓库·低代码·restful·etl
Francek Chen5 小时前
【大数据存储与管理】分布式数据库HBase:06 HBase编程实践
大数据·数据库·hadoop·分布式·hbase
二进制_博客6 小时前
使用Datax批量将mysql数据导入hive
数据库·hive·mysql
RestCloud6 小时前
2026年数据管道可观测性:ETL监控从被动告警到主动预警
数据仓库·数据安全·etl·数据集成·数据同步·数据监控
talen_hx2969 小时前
《零基础入门Spark》学习笔记 Day 10
大数据·hive·笔记·学习·spark
二进制_博客9 小时前
Spark On Hive 系统整合
大数据·hive·spark
源码之家9 小时前
计算机毕业设计:基于Python的二手车数据分析可视化系统 Flask框架 可视化 时间序列预测算法 逻辑回归 requests 爬虫 大数据(建议收藏)✅
大数据·hadoop·python·算法·数据分析·flask·课程设计
QEasyCloud20229 小时前
企业数据仓库建设:架构设计与实施方法
数据仓库
泯仲1 天前
项目实践|ETL Pipeline 完整解析:从多源文档到向量库的全链路实现
数据仓库·agent·etl·rag
被摘下的星星1 天前
Hadoop伪分布式集群搭建实验原理概要
大数据·hadoop·分布式