Hive笔记-6

6.2.8 聚合函数

1) 语法
  • count(*),表示统计所有行数,包含null值;

  • count(某列),表示该列一共有多少行,不包含null值;

  • max(),求最大值,不包含null,除非所有值都是null;

  • min(),求最小值,不包含null,除非所有值都是null;

  • sum(),求和,不包含null。

  • avg(),求平均值,不包含null。

2) 案例实操
(1) 求总行数 (count)
sql 复制代码
hive (default)> select count(*) cnt from emp;

hive sql执行过程:

count不仅可以传一个 * 还可以传一个(字段)

null 值是不统计在内

null 值是不会被统计在内的

(2) 求工资的最大值 (max)
sql 复制代码
hive (default)> select max(sal) max_sal from emp;

hive sql执行过程:

(3) 求工资的最小值 (min)
sql 复制代码
hive (default)> select min(sal) min_sal from emp;

hive sql执行过程:

(4) 求工资的总和 (sum)
sql 复制代码
hive (default)> select sum(sal) sum_sal from emp; 

hive sql执行过程:

(5) 求工资的平均值 (avg)
sql 复制代码
hive (default)> select avg(sal) avg_sal from emp;

hive sql执行过程:

6.3 分组

6.3.1 Group By 语句

Group By语句通常会和聚合函数一起使用,按照一个或者多个列队结果进行分组,然后对每个组执行聚合操作。

1) 案例实操:

把job分组后查看

sql 复制代码
select count(*) from emp group by job

结果:

看起来有点不太对劲,再改一下:

在count(*)前面加个job

现在看的清楚多了

注意:

注意: 当你 group by job 的时候,

那你只能select 后面跟 job 不能是其他的字段

(1) 计算emp表每个部门的平均工资
sql 复制代码
hive (default)> 
select 
    t.deptno, 
    avg(t.sal) avg_sal 
from emp t 
group by t.deptno;

hive sql执行过程:

(2)计算emp每个部门中每个岗位的最高薪水。

sql 复制代码
hive (default)>
select 
    t.deptno, 
    t.job, 
    max(t.sal) max_sal 
from emp t 
group by t.deptno, t.job;

hive sql执行过程:

6.3.2 Having 语句

1) having 与 where 不同点
(1) where 后面不能写分组聚合函数,而having后面可以使用分组聚合函数
(2) having 只用于 group by 分组统计语句
2) 案例实操

找这张表里人数大于等于2的:

输入代码:

得到输出结果:

但是当我不想要嵌套子查询时:

可见where字句行不通

因为where是用来过滤一行一行的数据

而已经group by 分组过了,where不能过滤组

于是我们只能用having来过滤一组一组的数据

那我们就用having:

(1) 求每个部门的平均薪水大于2000的部门
1.求每个部门的平均工资
sql 复制代码
hive (default)> 
select 
    deptno, 
    avg(sal) 
from emp 
group by deptno;

hive sql执行过程:

2.求每个部门的平均薪水大于2000的部门
sql 复制代码
hive (default)>
select 
    deptno, 
    avg(sal) avg_sal 
from emp 
group by deptno  
having avg_sal > 2000;

hive sql执行过程:

相关推荐
小陈phd6 分钟前
多模态大模型学习笔记(四十三)—— 视觉定位(Visual Grounding):语言描述在图像中的精准锚定
笔记·学习·目标跟踪
searchforAI12 分钟前
怎么把视频里的PPT提取出来?视频转图文笔记完整方案
人工智能·笔记·gpt·ai·音视频·语音识别·ppt
東雪木11 小时前
多线程与并发编程 专属复习笔记
java·开发语言·笔记·java面试
Oll Correct11 小时前
实验二十九:TCP的运输连接管理
网络·笔记
飞翔中文网13 小时前
Java学习笔记之抽象类与接口(设计思想)
java·笔记·学习
智者知已应修善业13 小时前
【proteus设计文氏正弦波信号发生器】2023-5-9
驱动开发·经验分享·笔记·硬件架构·proteus·硬件工程
凉、介15 小时前
深入理解 ARMv8-A|处理器模式与寄存器
笔记·学习·嵌入式·arm
whyTeaFo15 小时前
MIT 6.1810: Lec 5: calling conventions and stack frames RISC-V
笔记
上课不要睡觉了16 小时前
【统计法规】4.1统计管理体制概述
笔记·统计师考试
墨白曦煜17 小时前
算法实战笔记:剥开回溯算法的外衣——从通用模板到高阶去重(八)
笔记·算法