【Hadoop实训】Hive 数据操作①

目录

一、准备文件

1、创建表

[2、 数据映射](#2、 数据映射)

二、HIVE的数据操作

1、基本查询

a、全表查询

b、选择特定字段查询

c、查询员工表总人数

d、查询员工表总工资额

e、查询5条员工表的信息

2、Where条件查询

a、查询工资等于5000的所有员工

b、查询工资在500到1000的员工信息

c、查询comm为空的所有员工信息

d、查询工资是1500和5000的员工信息

[3、Liket 和 Rlike](#3、Liket 和 Rlike)

a、查找工资以2开头的员工信息

b、查找工资的第二个数值为2的员工信息

c、查找工资中含有2的员工信息


一、准备文件

1、创建表

准备两个文件emp.txt和dept.txt

创建表(在hive上操作) ,先进入itcast 命令:

复制代码
use itcast;

create table emp(empno int,ename string,job string,mgr int,hiredate string,sal double,comm double,deptno int)row format delimited fields  terminated by '\t';

create table dept(deptno int,dname string,loc int) row format delimited fields  terminated by '\t';

2、 数据映射

创建表完成后,将数据文件移动到对应的HDFS路径下,完成数据映射。

二、HIVE的数据操作

1、基本查询

a、全表查询

复制代码
select * from emp;

b、选择特定字段查询

复制代码
select deptno,dname from dept;

c、查询员工表总人数

复制代码
select count(*) cnt from emp;

d、查询员工表总工资额

复制代码
select sum(sal) sum_sal from emp;

e、查询5条员工表的信息

复制代码
select * from emp limit 5;

2、Where条件查询

a、查询工资等于5000的所有员工

复制代码
select * from emp where sal=5000;

b、查询工资在500到1000的员工信息

复制代码
select * from emp where sal between 500 and 1000;

c、查询comm为空的所有员工信息

复制代码
select * from emp where comm is null;

d、查询工资是1500和5000的员工信息

复制代码
select * from emp where sal IN (1500,5000);

3、Liket 和 Rlike

a、查找工资以2开头的员工信息

复制代码
select * fcom emp where sal LIKE '2%';

b、查找工资的第二个数值为2的员工信息

复制代码
hive> select * from emp wheresal LIKE '_2%';

c、查找工资中含有2的员工信息

复制代码
select * from cmp where sal RLIKE ' [2] ';

此模块分为两篇文章哦,继续学习请参考以下链接:【Hadoop实训】Hive 数据操作②-CSDN博客

相关推荐
starandsea4 小时前
gitlab解决传过大文件后删除导致pack过大问题
大数据·elasticsearch·gitlab
拉姆哥的小屋6 小时前
时间序列早期分类中的置信度累积问题:从ECE-C到时序依赖建模
大数据·人工智能
蚁巡信息巡查系统6 小时前
政府网站与政务新媒体监测服务主要是做什么的?
大数据·人工智能
饼干吖6 小时前
hadoop安装
大数据·hadoop·教程
私域实战笔记9 小时前
选企业微信服务商哪家好?从工具适配与行业案例看选型逻辑
大数据·人工智能·企业微信
AI企微观察9 小时前
企业微信社群运营玩法有哪些?企业微信社群工具有哪些功能?——从拉新到留存的玩法设计与工具支撑
大数据·人工智能
金融小师妹10 小时前
OpenAI拟借AI估值重构浪潮冲击1.1万亿美元IPO——基于市场情绪因子与估值量化模型的深度分析
大数据·人工智能·深度学习·1024程序员节
wudl556611 小时前
Flink Keyed State 详解之二
大数据·flink
IT学长编程11 小时前
计算机毕业设计 基于Python的热门游戏推荐系统的设计与实现 Django 大数据毕业设计 Hadoop毕业设计选题【附源码+文档报告+安装调试】
大数据·python·django·毕业设计·课程设计·毕业论文
Ashlee_code12 小时前
什么是TRS收益互换与场外个股期权:从金融逻辑到系统开发实践
大数据·人工智能·python·金融·系统架构·清算·柜台