Hive-内部表和外部表

区别

内部表实例

准备数据

查看数据

删除数据

外部表实例

准备数据

查看数据

删除数据


区别

内部表 :管理元数据(记录数据的文件和目录的信息)和数据。当删除内部表时,会删除数据和表的元数据,所以当多个表关联同一个文件时,其中一个表删除了,其他表也将会没有数据。

外部表:只管理元数据。删除表并不会影响其他表数据。【推荐】

内部表实例

准备数据

bash 复制代码
1,张三,工程部,75000
2,李四,市场部,80000
3,王五,财务部,85000
4,赵六,工程部,95000
5,孙七,人事部,60000

建库

bash 复制代码
-- 创建库
drop database if exists db_2 cascade;
create database db_2;
use db_2;

建表:分别创建3个内部表 依赖同一个文件

bash 复制代码
-- 1.1 创建内部表  依赖 文件1
CREATE TABLE IF NOT EXISTS db_2.employee (
    id INT,
    name STRING,
    department STRING,
    salary FLOAT
)
row format delimited fields terminated by ','
location '/test/external/employee_data'
;

select * from db_2.employee;

-- 1.2 创建内部表2 依赖 文件1
CREATE TABLE IF NOT EXISTS db_2.employee_2 (
    id INT,
    name STRING,
    department STRING,
    salary FLOAT
)
row format delimited fields terminated by ','
location '/test/external/employee_data'
;

select * from db_2.employee_2;

-- 1.3 创建内部表3 依赖 文件1
CREATE TABLE IF NOT EXISTS db_2.employee_3 (
    id INT,
    name STRING,
    department STRING,
    salary FLOAT
)
row format delimited fields terminated by ','
location '/test/external/employee_data'
;

select * from db_2.employee_3;

查看数据

bash 复制代码
-- 验证数据加载
SELECT * FROM tb_archer;

删除数据

bash 复制代码
-- 删除内部表1
drop table db_2.employee;

删除内部表后,数据也被删除了

删除内部表1,内部表2和内部表3没有数据

外部表实例

准备数据

bash 复制代码
-- 2.1 创建外部表  依赖 文件1
CREATE external TABLE IF NOT EXISTS db_2.tb_employee_external (
    id INT,
    name STRING,
    department STRING,
    salary FLOAT
)
row format delimited fields terminated by ','
location '/test/external/employee_data'
;

-- 1.2 创建外部表2 依赖 文件1
CREATE external TABLE IF NOT EXISTS db_2.tb_employee_external_2 (
    id INT,
    name STRING,
    department STRING,
    salary FLOAT
)
row format delimited fields terminated by ','
location '/test/external/employee_data'
;

-- 1.3 创建外部表3 依赖 文件1
CREATE external TABLE IF NOT EXISTS db_2.tb_employee_external_3 (
    id INT,
    name STRING,
    department STRING,
    salary FLOAT
)
row format delimited fields terminated by ','
location '/test/external/employee_data'
;

查看数据

bash 复制代码
select * from db_2.tb_employee_external;

删除数据

bash 复制代码
drop table db_2.tb_employee_external;

删除外部表,仍然还有数据,只是把元数据删除了

删除外部表后,其他关联数据的表仍有数据

相关推荐
B站计算机毕业设计超人9 小时前
计算机毕业设计Python+大模型音乐推荐系统 音乐数据分析 音乐可视化 音乐爬虫 知识图谱 大数据毕业设计
人工智能·hadoop·爬虫·python·数据分析·知识图谱·课程设计
归去来?10 小时前
记录一次从https接口提取25G大文件csv并落表的经历
大数据·数据仓库·hive·python·网络协议·5g·https
徐先生 @_@|||14 小时前
数据分析体系全览导图综述
大数据·hadoop·分布式·数据分析
無森~15 小时前
Hive 函数
hive·hadoop·sql
zgl_2005377917 小时前
源代码:ZGLanguage 解析SQL数据血缘 之 显示 UPDATE SQL 结构图
大数据·数据库·数据仓库·hadoop·数据治理·sql解析·数据血缘
無森~20 小时前
Hive核心SQL(基础)
hive·hadoop·sql
徐先生 @_@|||20 小时前
大数据技术栈演进:从MapReduce到云原生计算的全面对比(2026年)
大数据·hadoop·云原生·spark·mapreduce
徐先生 @_@|||20 小时前
大数据处理框架(Hadoop VS PySpark)
大数据·hadoop·分布式·spark·k8s·yarn
yumgpkpm1 天前
银行智能数据平台在Cloudera CDH6\CDP 7\CMP 7平台下的具体使用配置流程
大数据·hive·hadoop·数据挖掘·flink·spark·cloudera
Francek Chen2 天前
【大数据基础】大数据处理架构Hadoop:02 Hadoop生态系统
大数据·hadoop·分布式·hdfs·架构