【大数据面试题】011Hive的内部外部表

~一步一个脚印,一天一道面试题~

hive内部表和外部表的区别

空白 内部表 外部表
定义 表结构和数据有Hive管理 表结构由Hive管理,数据可由其他导入
删除表时 表结构被删除,数据也被清除 表结构被删除,但数据不变
导入数据 使用Hive SQL 导入 将新增的数据文件放到正确的位置即可

生产环境中为什么建议使用外部表?

1.安全性:避免误操作导致数据丢失

2.共享性:多个不同表可以共用同一份数据源进行不同的ETL逻辑处理

3.灵活性:当对表结构进行调整时,无需额外备份数据

相关推荐
Elastic 中国社区官方博客2 小时前
使用真实 Elasticsearch 进行高级集成测试
大数据·数据库·elasticsearch·搜索引擎·全文检索·jenkins·集成测试
一张假钞3 小时前
Spark SQL读写Hive Table部署
hive·sql·spark
好记性+烂笔头3 小时前
4 Spark Streaming
大数据·ajax·spark
Dr.勿忘3 小时前
C#面试常考随笔8:using关键字有哪些用法?
开发语言·unity·面试·c#·游戏引擎
想做富婆4 小时前
Hive:窗口函数[ntile, first_value,row_number() ,rank(),dens_rank()]和自定义函数
数据仓库·hive·hadoop
好记性+烂笔头6 小时前
3 Flink 运行架构
大数据·架构·flink
字节侠7 小时前
Flink2支持提交StreamGraph到Flink集群
大数据·flink·streamgraph·flink2·jobgraph
今天也想MK代码9 小时前
写好简历的三个关键认知
面试·职场和发展
好记性+烂笔头10 小时前
4 Hadoop 面试真题
大数据·hadoop·面试
好记性+烂笔头11 小时前
10 Flink CDC
大数据·flink