2023.11.14-hive之表操作练习和文件导入练习

目录

需求1.数据库基本操作

[需求2. 默认分隔符案例](#需求2. 默认分隔符案例)


需求1.数据库基本操作

-- 1.创建数据库test_sql,cs1,cs2,cs3

sql 复制代码
create database test_sql;
create database cs1;
create database cs2;
create database cs3;

-- 2.1删除数据库cs2

sql 复制代码
drop database cs2;

-- 2.2在cs3库中创建一个stu表,有id,name两个字段,然后删除cs3

sql 复制代码
use cs3;
create table stu(
    id int,
    name string);
drop database cs3 cascade ; --有表的库要加cascade

-- 3.切换数据库cs1

sql 复制代码
use cs1;

-- 4.1查询所有数据库

sql 复制代码
show databases ;

-- 4.2查看当前使用的数据库 select current_database

sql 复制代码
select current_database();

-- 4.3查看cs1数据库信息 desc database 表名

sql 复制代码
desc database cs1;

需求2. 默认分隔符案例

文件team_ace_player.txt中记录了手游《王者荣耀》主要战队内最受欢迎的王牌选手信息,内容如下,分隔符是hive的默认分隔符,要求在Hive中建表,把对应的数据存储到hdfs中

1成都AG超玩会一诺 2重庆QGhappyHurt 3DYG久诚 4上海EDG.M浪浪 5武汉eStarProCat 6RNG.M暴风锐 7RW侠渡劫 8TES滔搏迷神 9杭州LGD大鹅伪装 10南京Hero久竞清融

字段:id、team_name(战队名称)、ace_player_name(王牌选手名字)

分析一下:数据都是原生数据类型,且字段之间分隔符是\001,因此在建表的时候可以省去row format语句,因为hive默认的分隔符就是\001

提示: 可以直接使用insert方式插入数据,也可以提前建文件把对应的文件上传到hdfs中

1.创建表
sql 复制代码
--步骤1创建表
create table team_ace(
    id int,
    team_name string,
    ace_player_name string
)row format delimited
fields terminated by ''
;
2.加载数据

txt文件如下

sql 复制代码
--步骤2加载数据,手动将此题目里的txt文件上传到hdfs中 ,然后加载到表中
load data inpath '/input/team_ace_player.txt' into table team_ace;
3.验证数据
sql 复制代码
--步骤3验证数据
select * from team_ace;
--结果如下

--1,成都AG超玩会,一诺
-- 2,重庆QGhappy,Hurt
-- 3,DYG,久诚
-- 4,上海EDG.M,浪浪
-- 5,武汉eStarPro,Cat
-- 6,RNG.M,暴风锐
-- 7,RW侠,渡劫
-- 8,TES滔搏,迷神
-- 9,杭州LGD大鹅,伪装
-- 10,南京Hero久竞,清融
--需求:请查询来自上海战队的ace选手名字
sql 复制代码
select ace_player_name from team_ace where team_name like '%上海%';
相关推荐
yumgpkpm4 小时前
CMP (类ClouderaCDP7.3(404次编译) )华为鲲鹏Aarch64(ARM)信创环境 查询2100w行 hive 查询策略
数据库·数据仓库·hive·hadoop·flink·mapreduce·big data
CoookeCola16 小时前
MovieNet(A holistic dataset for movie understanding) :面向电影理解的多模态综合数据集与工具链
数据仓库·人工智能·目标检测·计算机视觉·数据挖掘
K_i1341 天前
Hadoop 集群自动化运维实战
运维·hadoop·自动化
Q26433650231 天前
【有源码】基于Python与Spark的火锅店数据可视化分析系统-基于机器学习的火锅店综合竞争力评估与可视化分析-基于用户画像聚类的火锅店市场细分与可视化研究
大数据·hadoop·python·机器学习·数据分析·spark·毕业设计
想ai抽2 天前
深入starrocks-多列联合统计一致性探查与策略(YY一下)
java·数据库·数据仓库
starfalling10242 天前
【hive】一种高效增量表的实现
hive
顧棟2 天前
【Yarn实战】Yarn 2.9.1滚动升级到3.4.1调研与实践验证
hadoop·yarn
D明明就是我2 天前
Hive 拉链表
数据仓库·hive·hadoop
嘉禾望岗5032 天前
hive join优化和数据倾斜处理
数据仓库·hive·hadoop
yumgpkpm2 天前
华为鲲鹏 Aarch64 环境下多 Oracle 数据库汇聚操作指南 CMP(类 Cloudera CDP 7.3)
大数据·hive·hadoop·elasticsearch·zookeeper·big data·cloudera