Hive内部表、外部表

Hive内部表、外部表

1. 内部表(Managed Table)

  • 内部表是由Hive完全管理的表,包括数据和元数据。
  • 当你删除内部表时,Hive会同时删除表的数据和元数据。
  • 内部表的数据存储在Hive指定的默认位置(通常是HDFS上的/user/hive/warehouse目录),不需要用户自己指定数据存储位置。
  • 创建内部表时,可以直接使用CREATE TABLE语句,并且不需要指定EXTERNAL关键字

2. 外部表(External Table)

  • 外部表也是由Hive管理的表,但是数据由用户自己管理。
  • 删除外部表时,只会删除表的元数据,不会删除数据本身。
  • 外部表的数据存储在用户指定的位置,可以是HDFS上的任何位置,也可以是本地文件系统或其他存储系统。
  • 创建外部表时,需要使用CREATE EXTERNAL TABLE语句,并且在表定义中使用LOCATION关键字来指定数据存储位置。

3.如何选择?

  • 当需要通过Hive完全管理控制表的整个生命周期时,请使用内部表

  • 当数据来之不易,防止误删,请使用外部表,因为即使删除表,文件也会被保留

  • 内部表适合管理Hive自己生成的数据,而外部表适合管理外部数据源,如已存在的数据文件或其他数据库中的数据。

相关推荐
yt948322 小时前
如何在IDE中通过Spark操作Hive
ide·hive·spark
青春之我_XP2 小时前
【基于阿里云搭建数据仓库(离线)】Data Studio创建资源与函数
大数据·数据仓库·sql·dataworks·maxcompute·data studio
Leo.yuan10 小时前
实时数据仓库是什么?数据仓库设计怎么做?
大数据·数据库·数据仓库·数据分析·spark
viperrrrrrrrrr71 天前
大数据学习(129)-Hive数据分析
大数据·hive·学习
伍六星1 天前
图片上传问题解决方案与实践
大数据·hive·hadoop
涤生大数据2 天前
Apache Doris 在数据仓库中的作用与应用实践
数据仓库·apache·doris
杨DaB2 天前
【JavaWeb】Maven、Servlet、cookie/session
hive·servlet·maven
IT成长日记2 天前
【Doris基础】Apache Doris vs 传统数据仓库:架构与性能的全面对比
数据仓库·架构·doris·doris vs 传统数据仓库
xx155802862xx2 天前
hive聚合函数多行合并
数据仓库·hive·hadoop
安审若无3 天前
Hive的存储格式如何优化?
数据仓库·hive·hadoop