【Hadoop实训】Hive 数据操作①

目录

一、准备文件

1、创建表

[2、 数据映射](#2、 数据映射)

二、HIVE的数据操作

1、基本查询

a、全表查询

b、选择特定字段查询

c、查询员工表总人数

d、查询员工表总工资额

e、查询5条员工表的信息

2、Where条件查询

a、查询工资等于5000的所有员工

b、查询工资在500到1000的员工信息

c、查询comm为空的所有员工信息

d、查询工资是1500和5000的员工信息

[3、Liket 和 Rlike](#3、Liket 和 Rlike)

a、查找工资以2开头的员工信息

b、查找工资的第二个数值为2的员工信息

c、查找工资中含有2的员工信息


一、准备文件

1、创建表

准备两个文件emp.txt和dept.txt

创建表(在hive上操作) ,先进入itcast 命令:

复制代码
use itcast;

create table emp(empno int,ename string,job string,mgr int,hiredate string,sal double,comm double,deptno int)row format delimited fields  terminated by '\t';

create table dept(deptno int,dname string,loc int) row format delimited fields  terminated by '\t';

2、 数据映射

创建表完成后,将数据文件移动到对应的HDFS路径下,完成数据映射。

二、HIVE的数据操作

1、基本查询

a、全表查询

复制代码
select * from emp;

b、选择特定字段查询

复制代码
select deptno,dname from dept;

c、查询员工表总人数

复制代码
select count(*) cnt from emp;

d、查询员工表总工资额

复制代码
select sum(sal) sum_sal from emp;

e、查询5条员工表的信息

复制代码
select * from emp limit 5;

2、Where条件查询

a、查询工资等于5000的所有员工

复制代码
select * from emp where sal=5000;

b、查询工资在500到1000的员工信息

复制代码
select * from emp where sal between 500 and 1000;

c、查询comm为空的所有员工信息

复制代码
select * from emp where comm is null;

d、查询工资是1500和5000的员工信息

复制代码
select * from emp where sal IN (1500,5000);

3、Liket 和 Rlike

a、查找工资以2开头的员工信息

复制代码
select * fcom emp where sal LIKE '2%';

b、查找工资的第二个数值为2的员工信息

复制代码
hive> select * from emp wheresal LIKE '_2%';

c、查找工资中含有2的员工信息

复制代码
select * from cmp where sal RLIKE ' [2] ';

此模块分为两篇文章哦,继续学习请参考以下链接:【Hadoop实训】Hive 数据操作②-CSDN博客

相关推荐
盘古信息IMS2 分钟前
注塑工厂上MES系统,如何选对厂商实现数智化跃迁?
大数据·人工智能·物联网
阿坤带你走近大数据1 小时前
OracleSQL优化案例-2
大数据·oracle·sql优化
快递鸟社区1 小时前
物流基础知识详解及高效管理工具应用
大数据
cd_949217211 小时前
新北洋亮相2026 CHINASHOP:以“智印零售全生态”赋能效率与增长
大数据·人工智能·零售
IoT物联网产品手记1 小时前
IoT产品模块化架构设计:从功能堆叠到能力组合的系统方法
大数据·人工智能·物联网
几分醉意.2 小时前
Bright Data Web Scraping 实战:用 MCP + Dify 构建 Amazon 数据采集 AI 工作流(2026 指南)
大数据·人工智能·bright data mcp·dift
redsea_HR2 小时前
2026年eHR系统选购:10大品牌核心差异对比
大数据·人工智能
电商API_180079052472 小时前
电商数据采集实战:批量自动化获取淘宝、京东商品评论数据
大数据·运维·人工智能·数据挖掘·数据分析·自动化
Linux运维技术栈2 小时前
Cloudflare Argo Smart Routing全球加速:优化跨境回源链路,提升跨区域访问体验
大数据·前端·数据库
无忧智库2 小时前
智库级深度复盘:商业航天星链协同测控云平台——从“单星孤岛”到“云网融合”的范式重构(WORD)
大数据·架构