【大数据面试题】011Hive的内部外部表

~一步一个脚印,一天一道面试题~

hive内部表和外部表的区别

空白 内部表 外部表
定义 表结构和数据有Hive管理 表结构由Hive管理,数据可由其他导入
删除表时 表结构被删除,数据也被清除 表结构被删除,但数据不变
导入数据 使用Hive SQL 导入 将新增的数据文件放到正确的位置即可

生产环境中为什么建议使用外部表?

1.安全性:避免误操作导致数据丢失

2.共享性:多个不同表可以共用同一份数据源进行不同的ETL逻辑处理

3.灵活性:当对表结构进行调整时,无需额外备份数据

相关推荐
李老头探索1 小时前
Java面试之Java中实现多线程有几种方法
java·开发语言·面试
floret*1 小时前
HiveSQL面试题
hive·sql
Dreams°1232 小时前
大数据 ETL + Flume 数据清洗 — 详细教程及实例(附常见问题及解决方案)
大数据·单元测试·可用性测试
sf_www2 小时前
Flink on YARN是如何确定TaskManager个数的
大数据·flink
武子康3 小时前
大数据-213 数据挖掘 机器学习理论 - KMeans Python 实现 距离计算函数 质心函数 聚类函数
大数据·人工智能·python·机器学习·数据挖掘·scikit-learn·kmeans
武子康3 小时前
大数据-214 数据挖掘 机器学习理论 - KMeans Python 实现 算法验证 sklearn n_clusters labels
大数据·人工智能·python·深度学习·算法·机器学习·数据挖掘
Aloudata4 小时前
NoETL自动化指标平台为数据分析提质增效,驱动业务决策
大数据·数据分析·指标平台·指标体系
2401_883041088 小时前
新锐品牌电商代运营公司都有哪些?
大数据·人工智能
青云交8 小时前
大数据新视界 -- 大数据大厂之 Impala 性能优化:融合机器学习的未来之路(上 (2-1))(11/30)
大数据·计算资源·应用案例·数据交互·impala 性能优化·机器学习融合·行业拓展
Json_1817901448011 小时前
An In-depth Look into the 1688 Product Details Data API Interface
大数据·json