hive的内部表(MANAGED_TABLE)和外部表(EXTERNAL_TABLE)的区别

1.hive的表类型分为外部表和内部表

内部表和外部表的主要区别在于数据的存储方式。

外部表:外部表的存储在hdfs中,是我们指定的文件目录,当我们删除数据或者删除分区的时候不会将元数据删除,数据还会在hdfs目录中,我们还可以进行数据挂载。

内部表:内部表的存储是在hdfs的默认目录下,当我们删除数据或者删除分区的时候会将元数据删除,数据文件也会被删除。

2.查看一个表是内部表还是外部表

DESCRIBE FORMATTED table_name

运行指令找到table_type 如果为MANAGED_TABLE,那就是内部表,

如果是EXTERNAL_TABLE,那就是外部表

3.创建内部表和外部表,外部表需要指定LOCATION

sql 复制代码
CREATE EXTERNAL TABLE external_table_name (
  column1 data_type,
  column2 data_type,
  ...
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
LOCATION '/path/to/table';


CREATE TABLE internal_table_name (
  column1 data_type,
  column2 data_type,
  ...
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ',';
相关推荐
Mephisto.java44 分钟前
【Hadoop|HDFS篇】NameNode和SecondaryNameNode
大数据·hadoop·hdfs
花菜回锅肉7 小时前
开源可视化大屏superset Docker环境部署
数据仓库·docker·容器·开源·superset
HHoao11 小时前
HiveServer2 启动时 datanucleus.schema.autoCreateTables 不生效的问题
大数据·hive
CodeMaster_3771484811 小时前
starrocks结合同步和异步物化视图建立数据湖和数据仓库
大数据·数据仓库
Casual_Lei11 小时前
Hive是什么?
数据仓库·hive·hadoop
柒拾柒_L1 天前
Nosql数据库
大数据·hadoop·redis·mongodb·数据分析·数据库架构
Mephisto.java1 天前
【Hadoop|MapReduce篇】MapReduce概述
大数据·hadoop·mapreduce
2401_851422401 天前
Centos优化Hadoop_linux优化hadoop
linux·hadoop·centos
Casual_Lei2 天前
Hive的优势与使用场景
数据仓库·hive·hadoop
浅雨梦梨2 天前
hadoop强制退出安全模式命令
大数据·hadoop·分布式