Hive——DML(Data Manipulation Language)数据操作语句用法详解

DML

1.Load

Load语句可将文件导入到Hive表中。

sql 复制代码
hive> 
LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename [PARTITION (partcol1=val1, partcol2=val2 ...)];

关键字说明:

  • local表示从本地加载数据到Hive表;否则从HDFS加载数据到Hive表
  • overwrite表示覆盖表中已有数据,否则表示追加。
  • partition表示上传到指定分区,若目标是分区表,需指定分区

1.加载本地文件到hive

本地文件路径:

执行load语句:
load data local inpath '/opt/module/hive-3.1.3/datas/student.txt' into table student;

查询数据(select * from student):

2.加载数据覆盖表中已有的数据

load data local inpath '/opt/module/hive-3.1.3/datas/student.txt' overwrite into table student;

3.加载HDFS文件到hive

上传文件到HDF根目录:

执行加载文件语句:
load data inpath '/student.txt' into table student;

从本地加载是copy的过程,从HDFS加载是move的过程。


2.Insert

1.将查询结果插入表中

INSERT (INTO | OVERWRITE) TABLE tablename [PARTITION (partcol1=val1, partcol2=val2 ...)] select_statement;

  • INTO将结果追加到目标表
  • OVERWRITE用结果覆盖原有数据

(1)新建一张表

sql 复制代码
hive (default)> 
create table student1(
    id int, 
    name string
) 
row format delimited fields terminated by '\t';

(2)根据查询结果插入数据

sql 复制代码
hive (default)> insert overwrite table student2 
select 
    id, 
    name 
from student;

2.将给定Values插入表中

INSERT (INTO | OVERWRITE) TABLE tablename [PARTITION (partcol1[=val1], partcol2[=val2] ...)] VALUES values_row [, values_row ...]

sql 复制代码
hive (default)> insert into table  student1 values(1,'wangwu'),(2,'zhaoliu');



3.将查询结果写入目标路径

INSERT OVERWRITE [LOCAL] DIRECTORY directory [ROW FORMAT row_format] [STORED AS file_format] select_statement;

sql 复制代码
insert overwrite local directory '/opt/module/datas/student' ROW FORMAT S ERDE 'org.apache.hadoop.hive.serde2.JsonSerDe'
select id,name from student;



3.Export&Import

  • Export导出语句可将表的数据和元数据信息一并导出到HDFS的路径
  • Import可将Export导出的内容导入Hive,表的数据和元数据信息都会恢复
  • ExportImport可用于两个Hive实例之间的数据迁移。
sql 复制代码
--导出
EXPORT TABLE tablename TO 'export_target_path'

--导入
IMPORT [EXTERNAL] TABLE new_or_original_tablename FROM 'source_path' [LOCATION 'import_target_path']

示例:

sql 复制代码
--导出
hive>
export table default.student to '/user/hive/warehouse/export/student';



sql 复制代码
--导入
hive>

import table student2 from '/user/hive/warehouse/export/student';
相关推荐
ApacheSeaTunnel13 小时前
新兴数据湖仓手册·从分层架构到数据湖仓架构(2025):数据仓库分层的概念与设计
大数据·数据仓库·开源·数据湖·dataops·白鲸开源·底层技术
洛克大航海14 小时前
Ubuntu中使用Hadoop的HDFS和MapReduce
hadoop·ubuntu·hdfs·mapreduce
夫唯不争,故无尤也20 小时前
Maven创建Java项目实战全流程
java·数据仓库·hive·hadoop·maven
想ai抽20 小时前
深入starrocks-怎样实现多列联合统计信息
java·数据库·数据仓库
还是大剑师兰特1 天前
Hadoop面试题及详细答案 110题 (71-85)-- 集群部署与运维
大数据·hadoop·大剑师·hadoop面试题
派可数据BI可视化1 天前
商业智能BI与业务结构分析
大数据·数据仓库·信息可视化·数据分析·商业智能bi
_清浅1 天前
大数据平台基础(Hadoop大数据原理与应用)
大数据·hadoop·分布式
The Sheep 20231 天前
WPF自定义路由事件
大数据·hadoop·wpf
还是大剑师兰特2 天前
Hadoop面试题及详细答案 110题 (86-95)-- Hadoop生态系统工具
hadoop·大剑师·hadoop面试题
yumgpkpm2 天前
CMP (类Cloudera) CDP7.3(400次编译)在华为鲲鹏Aarch64(ARM)信创环境中的性能测试过程及命令
大数据·hive·hadoop·python·elasticsearch·spark·cloudera