Hive内部表和外部表的区别

  • 未被 external修饰的是部表

  • external修饰的为部表。

区别:

  1. 部表数据由 Hive自身管理;
    部表数据由 HDFS管理;

  2. 部表数据存储的位置是 hive.metastore.warehouse.dir(默认:/user/hive/warehouse)
    部表数据的存储位置由自己制定(如果没有LOCATION,Hive将在HDFS上的/user/hive/warehouse文件夹下以外部表的表名创建一个文件夹,并将属于这个表的数据存放在这里);

  3. 删除部表会直接删除元数据(metadata)及存储数据;

    删除部表仅仅会删除元数据,HDFS上的文件并不会被删除。


我们下期见,拜拜!

相关推荐
二二孚日27 分钟前
自用华为ICT云赛道Big Data第四章知识点-Flink流批一体分布式实时处理引擎
大数据·华为
xufwind1 小时前
spark standlone 集群离线安装
大数据·分布式·spark
AI数据皮皮侠2 小时前
中国区域10m空间分辨率楼高数据集(全国/分省/分市/免费数据)
大数据·人工智能·机器学习·分类·业界资讯
DeepSeek大模型官方教程3 小时前
NLP之文本纠错开源大模型:兼看语音大模型总结
大数据·人工智能·ai·自然语言处理·大模型·产品经理·大模型学习
大数据CLUB4 小时前
基于spark的奥运会奖牌变化数据分析
大数据·hadoop·数据分析·spark
Edingbrugh.南空4 小时前
Hadoop高可用集群搭建
大数据·hadoop·分布式
智慧化智能化数字化方案5 小时前
69页全面预算管理体系的框架与落地【附全文阅读】
大数据·人工智能·全面预算管理·智慧财务·智慧预算
武子康5 小时前
大数据-33 HBase 整体架构 HMaster HRegion
大数据·后端·hbase
诗旸的技术记录与分享19 小时前
Flink-1.19.0源码详解-番外补充3-StreamGraph图
大数据·flink
资讯分享周19 小时前
Alpha系统联结大数据、GPT两大功能,助力律所管理降本增效
大数据·gpt