【大数据面试题】011Hive的内部外部表

~一步一个脚印,一天一道面试题~

hive内部表和外部表的区别

空白 内部表 外部表
定义 表结构和数据有Hive管理 表结构由Hive管理,数据可由其他导入
删除表时 表结构被删除,数据也被清除 表结构被删除,但数据不变
导入数据 使用Hive SQL 导入 将新增的数据文件放到正确的位置即可

生产环境中为什么建议使用外部表?

1.安全性:避免误操作导致数据丢失

2.共享性:多个不同表可以共用同一份数据源进行不同的ETL逻辑处理

3.灵活性:当对表结构进行调整时,无需额外备份数据

相关推荐
zhixingheyi_tian4 小时前
Spark 之 Aggregate
大数据·分布式·spark
PersistJiao4 小时前
Spark 分布式计算中网络传输和序列化的关系(一)
大数据·网络·spark
宅小海7 小时前
scala String
大数据·开发语言·scala
小白的白是白痴的白7 小时前
11.17 Scala练习:梦想清单管理
大数据
java1234_小锋7 小时前
Elasticsearch是如何实现Master选举的?
大数据·elasticsearch·搜索引擎
周三有雨10 小时前
【面试题系列Vue07】Vuex是什么?使用Vuex的好处有哪些?
前端·vue.js·面试·typescript
JessieZeng aaa10 小时前
CSV文件数据导入hive
数据仓库·hive·hadoop
爱米的前端小笔记10 小时前
前端八股自学笔记分享—页面布局(二)
前端·笔记·学习·面试·求职招聘
好学近乎知o10 小时前
解决sql字符串
面试
Java 第一深情12 小时前
零基础入门Flink,掌握基本使用方法
大数据·flink·实时计算