hive的内部表(MANAGED_TABLE)和外部表(EXTERNAL_TABLE)的区别

1.hive的表类型分为外部表和内部表

内部表和外部表的主要区别在于数据的存储方式。

外部表:外部表的存储在hdfs中,是我们指定的文件目录,当我们删除数据或者删除分区的时候不会将元数据删除,数据还会在hdfs目录中,我们还可以进行数据挂载。

内部表:内部表的存储是在hdfs的默认目录下,当我们删除数据或者删除分区的时候会将元数据删除,数据文件也会被删除。

2.查看一个表是内部表还是外部表

DESCRIBE FORMATTED table_name

运行指令找到table_type 如果为MANAGED_TABLE,那就是内部表,

如果是EXTERNAL_TABLE,那就是外部表

3.创建内部表和外部表,外部表需要指定LOCATION

sql 复制代码
CREATE EXTERNAL TABLE external_table_name (
  column1 data_type,
  column2 data_type,
  ...
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
LOCATION '/path/to/table';


CREATE TABLE internal_table_name (
  column1 data_type,
  column2 data_type,
  ...
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ',';
相关推荐
weixin_307779132 小时前
在AWS上使用KMS客户端密钥加密S3文件,同时支持PySpark读写和Snowflake导入
大数据·数据仓库·python·spark·云计算
想做富婆11 小时前
Hive:复杂数据类型之Map函数
数据仓库·hive·hadoop
想做富婆13 小时前
hive:基本数据类型,关于表和列语法
大数据·hive·hadoop
梦醒沉醉14 小时前
单机伪分布Hadoop详细配置
大数据·hadoop·分布式
WHYBIGDATA1 天前
Hive安装教程
大数据·hive·hadoop
想做富婆1 天前
Hive:struct数据类型,内置函数(日期,字符串,类型转换,数学)
数据仓库·hive·hadoop
乙卯年QAQ1 天前
【Hadoop】Hadoop 概述
大数据·hadoop·分布式
黄雪超1 天前
深入MapReduce——从MRv1到Yarn
大数据·hadoop·mapreduce
想做富婆1 天前
Hive:基本查询语法
数据仓库·hive·hadoop