【大数据面试题】011Hive的内部外部表

~一步一个脚印,一天一道面试题~

hive内部表和外部表的区别

空白 内部表 外部表
定义 表结构和数据有Hive管理 表结构由Hive管理,数据可由其他导入
删除表时 表结构被删除,数据也被清除 表结构被删除,但数据不变
导入数据 使用Hive SQL 导入 将新增的数据文件放到正确的位置即可

生产环境中为什么建议使用外部表?

1.安全性:避免误操作导致数据丢失

2.共享性:多个不同表可以共用同一份数据源进行不同的ETL逻辑处理

3.灵活性:当对表结构进行调整时,无需额外备份数据

相关推荐
程序猿进阶19 分钟前
深入解析 Spring WebFlux:原理与应用
java·开发语言·后端·spring·面试·架构·springboot
szxinmai主板定制专家39 分钟前
【国产NI替代】基于FPGA的32通道(24bits)高精度终端采集核心板卡
大数据·人工智能·fpga开发
TGB-Earnest2 小时前
【py脚本+logstash+es实现自动化检测工具】
大数据·elasticsearch·自动化
大圣数据星球4 小时前
Fluss 写入数据湖实战
大数据·设计模式·flink
suweijie7684 小时前
SpringCloudAlibaba | Sentinel从基础到进阶
java·大数据·sentinel
LCG元8 小时前
【面试问题】JIT 是什么?和 JVM 什么关系?
面试·职场和发展
Data跳动10 小时前
Spark内存都消耗在哪里了?
大数据·分布式·spark
woshiabc11111 小时前
windows安装Elasticsearch及增删改查操作
大数据·elasticsearch·搜索引擎
lucky_syq11 小时前
Saprk和Flink的区别
大数据·flink