Hive内部表和外部表的区别

  • 未被 external修饰的是部表

  • external修饰的为部表。

区别:

  1. 部表数据由 Hive自身管理;
    部表数据由 HDFS管理;

  2. 部表数据存储的位置是 hive.metastore.warehouse.dir(默认:/user/hive/warehouse)
    部表数据的存储位置由自己制定(如果没有LOCATION,Hive将在HDFS上的/user/hive/warehouse文件夹下以外部表的表名创建一个文件夹,并将属于这个表的数据存放在这里);

  3. 删除部表会直接删除元数据(metadata)及存储数据;

    删除部表仅仅会删除元数据,HDFS上的文件并不会被删除。


我们下期见,拜拜!

相关推荐
`林中水滴`2 小时前
【数据仓库】Iceberg、Hudi、Delta Lake、Paimon:四大开源湖表格式怎么选?
数据仓库
黄昏回响2 小时前
计算机系统基础知识(补充篇):数据库——数据仓库、数据中台与大数据技术详解
大数据·数据库·数据仓库
ACP广源盛139246256732 小时前
ASW3810@ACP#4 路差分 2:1/1:2 双向多路复用 / 解复用器 产品规格与应用总结
大数据·单片机·嵌入式硬件·计算机外设·电脑
dinl_vin2 小时前
一文通关Spark
大数据·分布式·spark
AI营销资讯站2 小时前
AI营销内容增长瓶颈?原圈科技以AI Agents破局之道
大数据·人工智能
hellolianhua2 小时前
测试集群hdfs和mapreduce
大数据·hadoop·hdfs
颜颜yan_3 小时前
面向工业物联网的大数据底座选型:Apache IoTDB 的架构能力与落地价值分析
大数据·物联网·apache
Cx330❀3 小时前
Linux System V标准简介
大数据·linux·运维·服务器·人工智能
jerryinwuhan3 小时前
Spark RDD 编程入门
大数据·分布式·spark
小陈工3 小时前
ModelEngine智能体开发实战:知识库自动生成与多Agent协作
大数据·网络·数据库·人工智能·python·django·异步