hive学习(三)

二、表的DDL操作

2.创建外部表

复制代码
create external table if not exists default.emp(
id int,
name string,
age int
)
row format delimited fields terminated by '\t'
location '/hive/data1' (此处目录可临时创建)

注:1)创建外部表要加上external关键字

2)location可以指定(存放在数据存放的具体目录),也可以不指定

(使用默认目录 /user/hive/warehouse)

3.导入数据(在建表的数据库位置执行)

复制代码
load data local inpath '/home/hadoop/data/a.txt' into table teacher;

注:需要注意的是,这里就算直接把txt文件的数据存放到hdfs上表对应的存储目录,那么在select * FROM时也能查出后来添加的数据,因为建表定义存放位置时,实际是指向具体的文件,将文件映射成表结构展示出来。

4.将外部表改为内部表

复制代码
alter table teacher set tblproperties('EXTERNAL'='FALSE');

5.内部表和外部表的区别

二、hive的其他命令

1.在hive client窗口查看本地文件系统

复制代码
hive(default)> ! ls /opt;

2.在hive client命令窗口中查看hdfs文件系统

复制代码
hive(default)> dfs -ls /;

三、HIve的分区表

概念:将表的数据分目录存储,存储在不同的文件夹下,然后按照不同的目录查询数据,不需要进行全量扫描,提升查询效率。(分区无上限,一般3个以内)

1.分区表的创建

复制代码
create table dog(
	id int,
	name string ;
	sex string
) 
partitioned by (month string, day string)
row format delimited fileds terminated by '\t';

注:1)分区字段不能是表中已经存在的字段。

2)分区字段可以不止一个,可以设置多个

2.增加分区

1)增加单个分区

复制代码
alter table dog add partition(dt='20240815');

2)增加多个分区

复制代码
alter table dog add partition(dt='20240816',dt='20240817')

3.删除分区

1)删除单个分区

复制代码
alter table dog drop partition(dt='20240815');

2)删除多个分区

复制代码
alter table dog drop partition('20240816'),partition(dt='20240817');

4.重命名分区

复制代码
alter table dog partition (dt='20240818') rename to partition (dt='20240817');

5.查看分区

复制代码
show partitions dog;

6.修改分区

更改分区文件存储格式

复制代码
ALTER TABLE table_name PARTITION (dt='20240817') SET FILEFORMAT file_format;

扩:修改表的名称

复制代码
alter table dog_partition1 rename to dog_1;
相关推荐
985小水博一枚呀4 小时前
【AI大模型学习路线】第二阶段之RAG基础与架构——第七章(【项目实战】基于RAG的PDF文档助手)技术方案与架构设计?
人工智能·学习·语言模型·架构·大模型
hello1114-5 小时前
Redis学习打卡-Day3-分布式ID生成策略、分布式锁
redis·分布式·学习
小Tomkk5 小时前
2025年PMP 学习二十 第13章 项目相关方管理
学习·pmp·项目pmp
独行soc6 小时前
2025年渗透测试面试题总结-百度面经(题目+回答)
运维·开发语言·经验分享·学习·面试·渗透测试·php
ysy16480672396 小时前
03算法学习_977、有序数组的平方
学习·算法
FAREWELL000756 小时前
Unity学习总结篇(1)关于各种坐标系
学习·unity·c#·游戏引擎
龙湾开发6 小时前
计算机图形学编程(使用OpenGL和C++)(第2版)学习笔记 12.曲面细分
c++·笔记·学习·3d·图形渲染
霸王蟹7 小时前
React中巧妙使用异步组件Suspense优化页面性能。
前端·笔记·学习·react.js·前端框架
houzhizhen7 小时前
Hive PredicatePushDown 谓词下推规则的计算逻辑
hive
jz_ddk7 小时前
[学习] RTKLib详解:rtcm2.c、rtcm3.c、rtcm3e与rtcmn.c
c语言·学习·算法