【Hive】drop table需注意外部表

什么是内部表,外部表?

比较专业的定义:

外部表需要转为内部表,执行删除操作才能真的删表结构删表数据。否则drop table仅是删除了表数据,表结构还是存在的。

alter table tb_name set TBLPROPERTIES('EXTERNAL'='false');

这个只是把表设成内部表,如果表本身是外部表的话。如果你本来表就是内部表就不用执行这个

drop table if exists tb_name ;

Q: 内部外部是对生产账号来说的对吗?

A: 不是,内部,外部,是表的一个类型,跟生产帐号没有关系。如果是外部表,你DROP的时候只会删除表分区,但表的文件依然存在,不会做清理。

所以,如果是外部表,你在DROP的时候相当于没有做清理

注意用spark执行会报错,以下语句要使用hive执行。

ALTER TABLE tb_name SET TBLPROPERTIES('EXTERNAL' = 'FALSE');

报错信息:

INFO Error in query: Cannot set or change the preserved property key: 'EXTERNAL';

在知乎看到的解决方案:https://zhuanlan.zhihu.com/p/161771826

(其实并没有说怎么解决,可能只能hive引擎使用)

相关推荐
修先生12 小时前
Hive Udf函数AES加密
hive·aes·udf
SeaTunnel17 小时前
Apache SeaTunnel 4 月有何新动作?连接器增强与 Zeta 稳定性提升等亮点速览
大数据·数据仓库·spark·apache·seatunnel
Volunteer Technology18 小时前
HDFS源码(二)
大数据·hadoop·hdfs
承渊政道18 小时前
Oracle迁移避坑:一个(+)写错,LEFT JOIN可能变INNER JOIN
运维·服务器·数据库·数据仓库·学习·安全·oracle
WL_Aurora18 小时前
MapReduce框架原理深度解析 | Shuffle机制、切片分区、Join全攻略
大数据·hadoop·mapreduce
赵渝强老师18 小时前
【赵渝强老师】Hadoop的伪分布部署模式
大数据·hadoop·分布式
Volunteer Technology19 小时前
HDFS源码(一)
大数据·hadoop·hdfs
AllData公司负责人1 天前
通过Postgresql同步到Doris,全视角演示AllData数据中台核心功能效果,涵盖:数据入湖仓,数据同步,数据处理,数据服务,BI可视化驾驶舱
java·大数据·数据库·数据仓库·人工智能·python·postgresql
WL_Aurora2 天前
HDFS底层原理深度解析 | 读写流程、NameNode工作机制、DataNode心跳与数据完整性
大数据·hadoop·hdfs
Pushkin.2 天前
新数仓建设方法论与实践指南-分层解耦驱动的数据仓库
大数据·数据仓库