Hive3:表操作常用语句-内部表、外部表

一、内部表

1、基本介绍

CREATE TABLE table_name ......

未被external关键字修饰的即是内部表, 即普通表。 内部表又称管理表,内部表数据存储的位置由hive.metastore.warehouse.dir参数决定(默认:/user/hive/warehouse),删除内部表会直接删除元数据(metadata)及存储数据,因此内部表不适合和其他工具共享数据。

2、创建表和数据

创建表并插入几条数据

sql 复制代码
create table if not exists stu(id int,name string);
insert into stu values (1,"zhangsan");
insert into stu values (2, "wangwu");
select * from stu;

查看hadoop中数据位置

会发现看不出有分隔符

默认的数据分隔符是:"\001"是一种特殊字符,是ASCII值,键盘是打不出来

3、自定义表的分隔符

sql 复制代码
create table if not exists stu2(id int ,name string) row format delimited fields terminated by '\t';

查看hadoop数据

发现,已经是\t分割了

4、删除表

sql 复制代码
DROP table stu2;

查看hadoop数据

发现hdfs中的stu2数据也被删除了

查看MySQL中的元数据

sql 复制代码
SELECT * FROM TBLS ;

也是没有stu2的元数据信息

二、外部表

1、基本介绍

CREATE EXTERNAL TABLE table_name ......LOCATION......

external关键字修饰的即是外部表, 即关联表。

外部表是指表数据可以在任何位置,通过LOCATION关键字指定。 数据存储的不同也代表了这个表在理念是并不是Hive内部管理的,而是可以随意临时链接到外部数据上的。

所以,在删除外部表的时候, 仅仅是删除元数据(表的信息),不会删除数据本身。

三、区别

相关推荐
梦里不知身是客1111 小时前
hive的全连接
hive
牛奶咖啡1311 小时前
Linux中安装部署Hadoop集群的保姆级安装配置教程
linux·hadoop·openjdk21安装配置·openjre21安装配置·hadoop集群安装配置·linux的ssh配置·linux实现免密登录配置
Kay_Liang12 小时前
【Hive 踩坑实录】从元数据库初始化到 HiveServer2 启动的全流程问题解决
大数据·linux·hive·hadoop·笔记·mysql·ubuntu
IT学长编程13 小时前
计算机毕业设计 基于Python的电商用户行为分析系统 Django 大数据毕业设计 Hadoop毕业设计选题【附源码+文档报告+安装调试】
大数据·hadoop·python·django·毕业设计·课程设计·电商用户行为分析系统
StarRocks_labs13 小时前
告别 Hadoop,拥抱 StarRocks!政采云数据平台升级之路
大数据·数据库·starrocks·hadoop·存算分离
2501_938780281 天前
《不止 MapReduce:Hadoop 与 Spark 的计算模型差异及适用场景分析》
hadoop·spark·mapreduce
2501_938773991 天前
《Hadoop 与 Spark 融合路径:基于 Spark on YARN 的部署与调优技巧》
大数据·hadoop·spark
2501_938773991 天前
大数据离线处理:使用 Airflow 调度 Hive 脚本的工作流设计
大数据·hive·hadoop
智海观潮1 天前
Hive的架构设计和建表语义
大数据·hadoop·apache hive
Timer_Cooker2 天前
Hive 分区表变更字段长度不生效
数据仓库·hive·hadoop