mysql之过滤分组

在MySQL中,过滤分组数据通常使用 GROUP BY 结合 HAVING 子句和 WHERE 子句。GROUP BY 子句用于将结果集按一个或多个列进行分组,而 HAVING 子句用于过滤分组后的数据。WHERE 子句用于过滤分组前的数据。下面是具体的用法和示例:

GROUP BY 子句

GROUP BY 子句用于根据一个或多个列对结果集进行分组。通常结合聚合函数(如 COUNTSUMAVGMAXMIN)使用。

基本语法
sql 复制代码
SELECT column1, column2, aggregate_function(column3)
FROM table_name
WHERE condition
GROUP BY column1, column2
ORDER BY column1, column2;

示例

  1. 按部门分组统计员工人数
sql 复制代码
SELECT department_id, COUNT(*) AS employee_count
FROM employees
GROUP BY department_id;

HAVING 子句

HAVING 子句用于过滤分组后的数据。它的作用类似于 WHERE 子句,但 WHERE 子句是在分组前过滤记录,而 HAVING 子句是在分组后过滤记录。

基本语法
sql 复制代码
SELECT column1, column2, aggregate_function(column3)
FROM table_name
WHERE condition
GROUP BY column1, column2
HAVING aggregate_function(column3) condition
ORDER BY column1, column2;

示例

  1. 按部门分组统计员工人数,并只显示员工人数超过5人的部门
sql 复制代码
SELECT department_id, COUNT(*) AS employee_count
FROM employees
GROUP BY department_id
HAVING COUNT(*) > 5;
  1. 按部门分组统计员工平均工资,并只显示平均工资高于5000的部门
sql 复制代码
SELECT department_id, AVG(salary) AS average_salary
FROM employees
GROUP BY department_id
HAVING AVG(salary) > 5000;

结合 WHEREHAVING

WHERE 子句和 HAVING 子句可以一起使用,WHERE 子句用于过滤原始数据,HAVING 子句用于过滤分组后的数据。

示例
  1. 在计算平均工资前过滤掉工资低于3000的员工,并按部门分组统计员工平均工资,只显示平均工资高于5000的部门
sql 复制代码
SELECT department_id, AVG(salary) AS average_salary
FROM employees
WHERE salary >= 3000
GROUP BY department_id
HAVING AVG(salary) > 5000;

复杂示例

以下是一个更复杂的示例,展示了如何结合使用 GROUP BYHAVING 和聚合函数来进行数据分析:

  1. 统计每个部门的员工人数、平均工资和最高工资,并只显示员工人数超过10且平均工资高于4000的部门
sql 复制代码
SELECT department_id,
       COUNT(*) AS employee_count,
       AVG(salary) AS average_salary,
       MAX(salary) AS max_salary
FROM employees
GROUP BY department_id
HAVING COUNT(*) > 10 AND AVG(salary) > 4000;

注意事项

  • WHEREHAVING 的区别WHERE 用于过滤原始数据行,HAVING 用于过滤分组后的数据行。
  • 使用聚合函数HAVING 子句通常用于包含聚合函数的条件过滤。
  • 性能考虑 :在大型数据集上,尽量先使用 WHERE 子句进行初步过滤,以减少分组和聚合的数据量,从而提高查询性能。
相关推荐
我科绝伦(Huanhuan Zhou)5 分钟前
Oracle控制文件、SCN与检查点机制深度解析及数据库初始化原理
运维·数据库·oracle
cui_win16 分钟前
MySQL max_connections连接数配置没生效,最终靠改这个参数解决
数据库·mysql
爱吃面条的猿20 分钟前
DBeaver 全能数据库管理工具的使用配置
数据库·dbeaver
杨云龙UP28 分钟前
从0到可落地:Oracle RMAN异地NFS备份标准脚本(多实例通用)
linux·运维·数据库·oracle
TDengine (老段)33 分钟前
网络延时对 TDengine TSDB 写入性能的影响:实验解析与实践建议
大数据·数据库·物联网·时序数据库·tdengine·涛思数据
古城小栈34 分钟前
吃透Cron表达式
linux·服务器·数据库
mpHH1 小时前
ivorysql 源码分析-双port兼容
数据库·学习·postgresql
真上帝的左手1 小时前
4. 关系型数据库-MySQL-架构
数据库·mysql·架构
haiyu柠檬1 小时前
迁移redis 集群从Ubuntu到Red Hat
数据库·redis·缓存