hive学习(三)

二、表的DDL操作

2.创建外部表

复制代码
create external table if not exists default.emp(
id int,
name string,
age int
)
row format delimited fields terminated by '\t'
location '/hive/data1' (此处目录可临时创建)

注:1)创建外部表要加上external关键字

2)location可以指定(存放在数据存放的具体目录),也可以不指定

(使用默认目录 /user/hive/warehouse)

3.导入数据(在建表的数据库位置执行)

复制代码
load data local inpath '/home/hadoop/data/a.txt' into table teacher;

注:需要注意的是,这里就算直接把txt文件的数据存放到hdfs上表对应的存储目录,那么在select * FROM时也能查出后来添加的数据,因为建表定义存放位置时,实际是指向具体的文件,将文件映射成表结构展示出来。

4.将外部表改为内部表

复制代码
alter table teacher set tblproperties('EXTERNAL'='FALSE');

5.内部表和外部表的区别

二、hive的其他命令

1.在hive client窗口查看本地文件系统

复制代码
hive(default)> ! ls /opt;

2.在hive client命令窗口中查看hdfs文件系统

复制代码
hive(default)> dfs -ls /;

三、HIve的分区表

概念:将表的数据分目录存储,存储在不同的文件夹下,然后按照不同的目录查询数据,不需要进行全量扫描,提升查询效率。(分区无上限,一般3个以内)

1.分区表的创建

复制代码
create table dog(
	id int,
	name string ;
	sex string
) 
partitioned by (month string, day string)
row format delimited fileds terminated by '\t';

注:1)分区字段不能是表中已经存在的字段。

2)分区字段可以不止一个,可以设置多个

2.增加分区

1)增加单个分区

复制代码
alter table dog add partition(dt='20240815');

2)增加多个分区

复制代码
alter table dog add partition(dt='20240816',dt='20240817')

3.删除分区

1)删除单个分区

复制代码
alter table dog drop partition(dt='20240815');

2)删除多个分区

复制代码
alter table dog drop partition('20240816'),partition(dt='20240817');

4.重命名分区

复制代码
alter table dog partition (dt='20240818') rename to partition (dt='20240817');

5.查看分区

复制代码
show partitions dog;

6.修改分区

更改分区文件存储格式

复制代码
ALTER TABLE table_name PARTITION (dt='20240817') SET FILEFORMAT file_format;

扩:修改表的名称

复制代码
alter table dog_partition1 rename to dog_1;
相关推荐
西岸行者9 天前
学习笔记:SKILLS 能帮助更好的vibe coding
笔记·学习
B站计算机毕业设计超人9 天前
计算机毕业设计Django+Vue.js高考推荐系统 高考可视化 大数据毕业设计(源码+LW文档+PPT+详细讲解)
大数据·vue.js·hadoop·django·毕业设计·课程设计·推荐算法
B站计算机毕业设计超人9 天前
计算机毕业设计Django+Vue.js音乐推荐系统 音乐可视化 大数据毕业设计 (源码+文档+PPT+讲解)
大数据·vue.js·hadoop·python·spark·django·课程设计
十月南城9 天前
数据湖技术对比——Iceberg、Hudi、Delta的表格格式与维护策略
大数据·数据库·数据仓库·hive·hadoop·spark
悠哉悠哉愿意9 天前
【单片机学习笔记】串口、超声波、NE555的同时使用
笔记·单片机·学习
别催小唐敲代码9 天前
嵌入式学习路线
学习
王九思9 天前
Hive Thrift Server 介绍
数据仓库·hive·hadoop
毛小茛9 天前
计算机系统概论——校验码
学习
babe小鑫9 天前
大专经济信息管理专业学习数据分析的必要性
学习·数据挖掘·数据分析
winfreedoms9 天前
ROS2知识大白话
笔记·学习·ros2