【Hadoop实训】Hive 数据操作①

目录

一、准备文件

1、创建表

[2、 数据映射](#2、 数据映射)

二、HIVE的数据操作

1、基本查询

a、全表查询

b、选择特定字段查询

c、查询员工表总人数

d、查询员工表总工资额

e、查询5条员工表的信息

2、Where条件查询

a、查询工资等于5000的所有员工

b、查询工资在500到1000的员工信息

c、查询comm为空的所有员工信息

d、查询工资是1500和5000的员工信息

[3、Liket 和 Rlike](#3、Liket 和 Rlike)

a、查找工资以2开头的员工信息

b、查找工资的第二个数值为2的员工信息

c、查找工资中含有2的员工信息


一、准备文件

1、创建表

准备两个文件emp.txt和dept.txt

创建表(在hive上操作) ,先进入itcast 命令:

复制代码
use itcast;

create table emp(empno int,ename string,job string,mgr int,hiredate string,sal double,comm double,deptno int)row format delimited fields  terminated by '\t';

create table dept(deptno int,dname string,loc int) row format delimited fields  terminated by '\t';

2、 数据映射

创建表完成后,将数据文件移动到对应的HDFS路径下,完成数据映射。

二、HIVE的数据操作

1、基本查询

a、全表查询

复制代码
select * from emp;

b、选择特定字段查询

复制代码
select deptno,dname from dept;

c、查询员工表总人数

复制代码
select count(*) cnt from emp;

d、查询员工表总工资额

复制代码
select sum(sal) sum_sal from emp;

e、查询5条员工表的信息

复制代码
select * from emp limit 5;

2、Where条件查询

a、查询工资等于5000的所有员工

复制代码
select * from emp where sal=5000;

b、查询工资在500到1000的员工信息

复制代码
select * from emp where sal between 500 and 1000;

c、查询comm为空的所有员工信息

复制代码
select * from emp where comm is null;

d、查询工资是1500和5000的员工信息

复制代码
select * from emp where sal IN (1500,5000);

3、Liket 和 Rlike

a、查找工资以2开头的员工信息

复制代码
select * fcom emp where sal LIKE '2%';

b、查找工资的第二个数值为2的员工信息

复制代码
hive> select * from emp wheresal LIKE '_2%';

c、查找工资中含有2的员工信息

复制代码
select * from cmp where sal RLIKE ' [2] ';

此模块分为两篇文章哦,继续学习请参考以下链接:【Hadoop实训】Hive 数据操作②-CSDN博客

相关推荐
TDengine (老段)3 小时前
TDengine IDMP 快速体验(方式二 通过 docker)
大数据·数据库·docker·ai·时序数据库·tdengine·涛思数据
小獾哥4 小时前
Centos8系统在安装Git包时,报错:“没有任何匹配: git”
大数据·git·elasticsearch
船长@Quant9 小时前
元数据管理与数据治理平台:Apache Atlas 基本搜索 Basic Search
hadoop·数据治理·元数据管理·数据血缘·gdpr合规·apache atlas
金融小师妹10 小时前
基于AI量化模型的比特币周期重构:传统四年规律是否被算法因子打破?
大数据·人工智能·算法
拓端研究室13 小时前
专题:2025人形机器人与服务机器人技术及市场报告|附130+份报告PDF汇总下载
大数据·人工智能
计算机源启编程14 小时前
大数据毕设选题-基于spark+hadoop技术的北京市医保药品分析与可视化系统的设计与实现
大数据
计算机程序员小杨15 小时前
你知道用Spark处理海洋污染大数据有多震撼吗?这套可视化系统告诉你答案
大数据
蝸牛ちゃん15 小时前
大数据系统架构模式:驾驭海量数据的工程范式
大数据·系统架构
哔哩哔哩技术16 小时前
B站模型训练存储加速实践
大数据
TDengine (老段)16 小时前
TDengine IDMP 基本功能(1.界面布局和操作)
大数据·数据库·物联网·ai·时序数据库·tdengine·涛思数据