Hive3：表操作常用语句-内部表、外部表

生产队队长2024-08-02 17:36

一、内部表

1、基本介绍

（CREATE TABLE table_name ......）

未被external关键字修饰的即是内部表，即普通表。内部表又称管理表,内部表数据存储的位置由hive.metastore.warehouse.dir参数决定（默认：/user/hive/warehouse），删除内部表会直接删除元数据（metadata）及存储数据，因此内部表不适合和其他工具共享数据。

2、创建表和数据

创建表并插入几条数据

sql 复制代码

create table if not exists stu(id int,name string);
insert into stu values (1,"zhangsan");
insert into stu values (2, "wangwu");
select * from stu;

查看hadoop中数据位置

会发现看不出有分隔符。

默认的数据分隔符是："\001"是一种特殊字符，是ASCII值，键盘是打不出来

3、自定义表的分隔符

sql 复制代码

create table if not exists stu2(id int ,name string) row format delimited fields terminated by '\t';

查看hadoop数据

发现，已经是\t分割了

4、删除表

sql 复制代码

DROP table stu2;

查看hadoop数据

发现hdfs中的stu2数据也被删除了

查看MySQL中的元数据

sql 复制代码

SELECT * FROM TBLS ;

也是没有stu2的元数据信息

二、外部表

1、基本介绍

（CREATE EXTERNAL TABLE table_name ......LOCATION......）

被external关键字修饰的即是外部表，即关联表。

外部表是指表数据可以在任何位置，通过LOCATION关键字指定。数据存储的不同也代表了这个表在理念是并不是Hive内部管理的，而是可以随意临时链接到外部数据上的。

所以，在删除外部表的时候，仅仅是删除元数据（表的信息），不会删除数据本身。

Hive3：表操作常用语句-内部表、外部表

一、内部表

1、基本介绍

2、创建表和数据

3、自定义表的分隔符

4、删除表

二、外部表

1、基本介绍

三、区别