Hive:内部表和外部表,内外转换

内部表和外部表

内部表示例

给表添加数据

外部表示例

给表添加数据

外部表示例

用location指定表目录位置,那么表的位置在实际指定的位置,但是可以被映射

外部表和内部表的区别

删除表后使用show tables in shao; 已经没有被删除的表,说明元数据已经被删除(mysql里面存放),但是使用Hue查看,外部表还在

在使用drop删除时,内部表会被删除元数据和数据文件,而外部表只会被删除元数据,数据文件还在HDFS上存储

在做数仓项目时,第一层是外部表可以确保数据文件不会被删除

内部表和外部表的转换

tblproperties表属性; 内部表转为外部表就是把外部表属性打开,外部表转内部表就是把外部表属性关闭

注意: TRUE必须大写,false大小写皆可

外部表转换为内部表后表的类型从 EXTERNAL_TABLE变成MANAGED TABLE

外部表转换为内部表后可以被drop删除

相关推荐
陆水A8 小时前
数仓主题域划分
大数据·数据仓库·数据库开发·etl·etl工程师
喻师傅12 小时前
Spark SQL 数组函数合集:array_agg、array_contains、array_sort…详解
大数据·hadoop·分布式·sql·spark
随心............12 小时前
hive专题面试总结
数据仓库·hive
isNotNullX13 小时前
主数据管理系统能代替数据中台吗?
大数据·数据仓库·人工智能·数据分析·etl
LiRuiJie1 天前
基于Hadoop3.3.4+Flink1.17.0+FlinkCDC3.0.0+Iceberg1.5.0整合,实现数仓实时同步mysql数据
大数据·hadoop·flink·iceberg·flinkcdc
cici158741 天前
Docker搭建Hadoop集群
hadoop·docker·eureka
码字的字节3 天前
ZooKeeper在Hadoop中的协同应用:从NameNode选主到分布式锁实现
hadoop·分布式·zookeeper·分布式锁
liliangcsdn4 天前
mac测试ollama llamaindex
数据仓库·人工智能·prompt·llama
码字的字节4 天前
深入解析YARN中的FairScheduler与CapacityScheduler:资源分配策略的核心区别
hadoop·capacity·fairscheduler
Johny_Zhao4 天前
Centos8搭建hadoop高可用集群
linux·hadoop·python·网络安全·信息安全·云计算·shell·yum源·系统运维·itsm