MySQL_聚合函数&分组查询

上篇复习:

设计数据库时的三大范式
1.第一范式,一行数据中每一列不可再分

关系型数据库必须要满足第一范式,设计表的时候,如果每一列都可以用SQL规定的数据类型描述,就天然满足第一范式.

2.第二范式,在第一范式的基础上,消除了部分函数依赖

一个表中存在复合主键,当有一列只依赖复合主键中的某一个键,那就这种设计就不满足第二范式不满足第二范式时会出现一些问题:数据冗余,更新异常,插入异常,删除异常如果一个表中的键只有一列时,那么这种设计就天然满足第二范式

3.第三范式,在第二范式的基础上,消除了传递依赖

数据库的关系模型
1.一对一关系
2.一对多关系
3.多对多关系
4.没有关系

设计表的过程
通过需求找出实体
确定实体之间的关系
根据不同的关系按照固定的方法去创建表

1.聚合函数

1.在 MySQL 中,聚合函数是用于计算多行数据的统计信息的函数,例如总和、平均值、最大值、最小值和行数等。聚合函数用于在查询结果中创建单个值,该值代表聚合操作的结果。将多行数据聚合成单个结果,这是聚合函数得名的由来。

以下是 MySQL 中常见的聚合函数:

在介绍以上函数时我们先看一下我们要操作表的数据:

1. COUNT()- 统计数量
  • 功能:统计指定列中的非空值个数,或者统计表中的总行数。
  • 使用场景:用于统计表中数据条数或分组数据条数。
    • COUNT(*):统计所有行的数量(包括空值)。
    • COUNT(column):统计指定列非空值的数量。

由上我们可以看到当数学行中有一个值为空时,count函数并没有那个为空的数据给统计当中。

2. SUM()- 计算总和
  • 功能:计算指定数值列的所有行的总和。
  • 使用场景:用于对数值列求和,如统计总销售额或总薪资。

当我们计算非数字的数据是,我们可以看到爆出了错误

如果对非数值类型的列进行运算,会得到一些警告信息

3. AVG()- 计算平均值
  • 功能:计算指定数值列的召唤。
  • 使用场景:用于求特定分数列的平均分数,如计算平均薪资或平均分数。
  • 求语文的平均值

2.求语文,数学,英语三门课的总分的平均值

4. MAX()- 获取峰值
  • 功能:返回指定列中的顶部。
  • 使用场景:用于查找特定列的顶峰,如最高薪资或最高分数。

1.找到数学最高分数:

5.-MIN()获取最小值
  • 功能:简单地返回指定列中。
  • 使用场景:用于轻松查找特定列,如最低薪资或最低份额。

1.找到英语最低分数:

2. GROUP BY 子句的讲解:

GROUP BY子句在MySQL中非常常用,通常用于对某些或某些列对数据进行分组 。它结合聚合函数(如COUNT()SUM()AVG()等)一起使用,用于对每个分组的数据进行统计或汇总。子句经常出现在查询语句的SELECT部分,目的是让数据库返回每一组的统计结果,而不是返回原始的每一行数据。

GROUP BY基本概念

  • 分组GROUP BY会根据指定的列将数据拆分为若干组。每个组中的数据具有相同的值(即在分组字段中相同的值会被归为一组)。
  • 聚合函数GROUP BY通常和聚合函数结合使用,比如COUNT()SUM()AVG()MAX()MIN()等,用于对每一组的数据进行汇总统计。
  • column1,column2等:这些是你希望根据其进行分组的列。
  • aggregate_function(column3):这个代表评估每个分组的聚合函数,column3是你要汇总的数据列。
  • table_name:数据表的名称。
  • WHERE:任选的筛选条件,GROUP BY会在应用WHERE筛选条件之后对数据进行分组。

GROUP BY应用程序

  1. 统计每个部门的员工数量
  2. 计算每个部门的平均工资
  3. 找到每个部门的最高薪资
  4. 按时间部分分组,统计每日或月刊的销售全国

GROUP BY的常见用法和示例

假设我们有如下表:

1.按部门分组,统计每个部门的员工数量

SELECT department, COUNT(*) AS num_employees

FROM employees

GROUP BY department;

解释 :按department列分组,统计每个部门的员工数量。

2.按部门分组,计算每个部门的薪资总和

SELECT department, SUM(salary) AS total_salary

FROM employees

GROUP BY department;

解释 :按department列分组,计算每个部门的薪资总和。

3.按部门分组,计算每个部门的平均工资

SELECT department, AVG(salary) AS avg_salary

FROM employees

GROUP BY department;

解释 :按department列分组,计算每个部门的平均工资。

这些代码示例展示了如何使用GROUP BY子句按不同的字段进行分组,并结合聚合函数(如COUNT()SUM()AVG()MAX()MIN())进行数据汇总。HAVING子句则用于对分组结果进行进一步筛选。

  • GROUP BY:将数据按一个或多个字段进行分组。
  • 聚合函数 :对每个分组的值进行聚合计算,如COUNT()SUM()AVG()等。

3. HAVING子句

在SQL中,HAVING子句允许对分组后的结果进行筛选,它通常与GROUP BY子句一起使用。你可以理解为,HAVINGWHERE的"分组后"版本,你在数据分组后进行过滤。

HAVING子句的作用

  • WHERE子句 :用于在分组之前对数据进行筛选。
  • HAVING子句 :用于在分组之后对分组结果进行筛选。

一般来说,HAVING可以过滤聚合函数计算后面的结果,比如COUNT()SUM()AVG()等聚合结果。通常情况下,WHERE子句不能用于聚合函数的筛选,因为WHERE是在数据行级别进行过滤的,而聚合函数是在分组中随后对数据进行计算的。

HAVING基本原理

  • WHERE:用于过滤原始数据行(可选)。
  • GROUP BY:用于将数据按一个或多个列进行分组。
  • HAVING:用于对分组后的结果进行筛选,常用于聚合函数的条件。

HAVING子句注意事项

  1. HAVING是在分组后使用的 ,它只能在聚合(如COUNT()、、SUM()AVG())计算完成后使用。

  2. HAVING子句可以处理聚合函数 ,而WHERE不能。

  3. HAVING可以与GROUP BY子句一起使用,来过滤那些不条件符合的分组。

  4. 查询每个部门的员工数量,但只返回员工数量大于 2 的部门

SELECT department, COUNT(*) AS num_employees FROM employees GROUP BY department HAVING COUNT(*) > 2;

解释 :按department字段分组,统计每个部门的员工数量,并用来HAVING COUNT(*) > 2筛选员工数量大于2的部门。

2.查询每个部门的薪资总和,但只返回薪资总和超过15000的部门

SELECT department, SUM(salary) AS total_salary

FROM employees

GROUP BY department

HAVING SUM(salary) > 15000;

解释 :按department字段分组,计算每个部门的薪资总和,并使用HAVING SUM(salary) > 15000来筛选薪资总和大于15000的部门。

3.查询每个部门的平均薪资,但只返回平均薪资大于5500的部门

SELECT department, AVG(salary) AS avg_salary

FROM employees

GROUP BY department

HAVING AVG(salary) > 5500;

解释 :按department字段分组,计算每个部门的平均薪资,并使用HAVING AVG(salary) > 5500来筛选平均薪资大于 5500 的部门。

  1. 查询每个部门的最高薪资,但只返回最高薪资大于 6000 的部门

SELECT department, MAX(salary) AS max_salary

FROM employees

GROUP BY department

HAVING MAX(salary) > 6000;

解释 :按department字段分区,查找每个部门的最高薪资,并使用HAVING MAX(salary) > 6000来筛选最高薪资大于 6000 的部门。

HAVING与此WHERE对比:

示例:WHEREHAVING的联合使用

有时你可能希望在WHERE子句中先过滤原始数据,然后再利用HAVING对分组结果进行进一步筛选。

SELECT department, COUNT(*) AS num_employees

FROM employees

WHERE salary > 5000 -- 先筛选薪资大于 5000 的员工

GROUP BY department

HAVING COUNT(*) > 1; -- 然后筛选员工数量大于 1 的部门

解释 :首先通过WHERE salary > 5000过滤薪资大于 5000 的员工,然后使用HAVING COUNT(*) > 1进一步筛选员工数量大于 1 的部门。

总结

  1. WHERE子句:用于在分组前过滤数据行。
  2. HAVING子句:用于在分组后对分组结果进行筛选,特别适用于聚合函数的条件过滤。
  3. HAVINGGROUP BY :通常与GROUP BY一起使用,便于对分组后的结果进行筛选。
  4. WHEREHAVING的结合使用 :先使用WHERE子句进行行级筛选,然后再使用子句HAVING进行分组后的筛选。

4. 结语

太棒了!🎉 你已经成功掌握了 MySQL 中的聚合函数和分组查询,像一个真正的数据库魔法师一样,能够轻松地在数据的海洋中捕捉到你想要的信息!💻✨

通过 `GROUP BY`,你已经学会了如何将数据分组,像整理书架一样,把数据按类别归档;而通过聚合函数(`COUNT()`、`SUM()`、`AVG()` 等),你可以轻松计算每个组的总和、平均数、最大值、最小值,甚至是每个小组的"英雄"------那些最独特的值!🌟

更妙的是,你还学会了如何结合 `HAVING` 子句,像一位细心的挑选者,在大海捞针的过程中精准筛选出最符合要求的数据分组!🧙‍♂️

就像烹饪一道完美的菜肴,掌握了这些基本的 SQL 工具,你已经有了无限的可能性去打造属于你的数据盛宴!数据的世界充满了无限乐趣和挑战,每一个查询语句都是一次探险,你的探索才刚刚开始!🚀

继续保持好奇心,动手实践,试着用你新学到的技巧解决更多的实际问题,做一个SQL小达人!如果有任何疑问,别忘了我始终在这儿,随时等候为你解答!加油!🎉💪

学习 MySQL 的旅程就像探险一样,充满了惊喜与成就感,愿你在这条数据之路上越走越远,开心又充实!🎈

相关推荐
Hsu_kk1 小时前
MySQL 批量删除海量数据的几种方法
数据库·mysql
编程学无止境1 小时前
第02章 MySQL环境搭建
数据库·mysql
knight-n1 小时前
MYSQL库的操作
数据库·mysql
包饭厅咸鱼2 小时前
QML----复制指定下标的ListModel数据
开发语言·数据库
生命几十年3万天2 小时前
redis时间优化
数据库·redis·缓存
Elastic 中国社区官方博客2 小时前
释放专利力量:Patently 如何利用向量搜索和 NLP 简化协作
大数据·数据库·人工智能·elasticsearch·搜索引擎·自然语言处理
力姆泰克2 小时前
看电动缸是如何提高农机的自动化水平
大数据·运维·服务器·数据库·人工智能·自动化·1024程序员节
力姆泰克2 小时前
力姆泰克电动缸助力农业机械装备,提高农机的自动化水平
大数据·服务器·数据库·人工智能·1024程序员节
Lionhacker2 小时前
网络工程师这个行业可以一直干到退休吗?
网络·数据库·网络安全·黑客·黑客技术