mysql之过滤分组

在MySQL中,过滤分组数据通常使用 GROUP BY 结合 HAVING 子句和 WHERE 子句。GROUP BY 子句用于将结果集按一个或多个列进行分组,而 HAVING 子句用于过滤分组后的数据。WHERE 子句用于过滤分组前的数据。下面是具体的用法和示例:

GROUP BY 子句

GROUP BY 子句用于根据一个或多个列对结果集进行分组。通常结合聚合函数(如 COUNTSUMAVGMAXMIN)使用。

基本语法
sql 复制代码
SELECT column1, column2, aggregate_function(column3)
FROM table_name
WHERE condition
GROUP BY column1, column2
ORDER BY column1, column2;

示例

  1. 按部门分组统计员工人数
sql 复制代码
SELECT department_id, COUNT(*) AS employee_count
FROM employees
GROUP BY department_id;

HAVING 子句

HAVING 子句用于过滤分组后的数据。它的作用类似于 WHERE 子句,但 WHERE 子句是在分组前过滤记录,而 HAVING 子句是在分组后过滤记录。

基本语法
sql 复制代码
SELECT column1, column2, aggregate_function(column3)
FROM table_name
WHERE condition
GROUP BY column1, column2
HAVING aggregate_function(column3) condition
ORDER BY column1, column2;

示例

  1. 按部门分组统计员工人数,并只显示员工人数超过5人的部门
sql 复制代码
SELECT department_id, COUNT(*) AS employee_count
FROM employees
GROUP BY department_id
HAVING COUNT(*) > 5;
  1. 按部门分组统计员工平均工资,并只显示平均工资高于5000的部门
sql 复制代码
SELECT department_id, AVG(salary) AS average_salary
FROM employees
GROUP BY department_id
HAVING AVG(salary) > 5000;

结合 WHEREHAVING

WHERE 子句和 HAVING 子句可以一起使用,WHERE 子句用于过滤原始数据,HAVING 子句用于过滤分组后的数据。

示例
  1. 在计算平均工资前过滤掉工资低于3000的员工,并按部门分组统计员工平均工资,只显示平均工资高于5000的部门
sql 复制代码
SELECT department_id, AVG(salary) AS average_salary
FROM employees
WHERE salary >= 3000
GROUP BY department_id
HAVING AVG(salary) > 5000;

复杂示例

以下是一个更复杂的示例,展示了如何结合使用 GROUP BYHAVING 和聚合函数来进行数据分析:

  1. 统计每个部门的员工人数、平均工资和最高工资,并只显示员工人数超过10且平均工资高于4000的部门
sql 复制代码
SELECT department_id,
       COUNT(*) AS employee_count,
       AVG(salary) AS average_salary,
       MAX(salary) AS max_salary
FROM employees
GROUP BY department_id
HAVING COUNT(*) > 10 AND AVG(salary) > 4000;

注意事项

  • WHEREHAVING 的区别WHERE 用于过滤原始数据行,HAVING 用于过滤分组后的数据行。
  • 使用聚合函数HAVING 子句通常用于包含聚合函数的条件过滤。
  • 性能考虑 :在大型数据集上,尽量先使用 WHERE 子句进行初步过滤,以减少分组和聚合的数据量,从而提高查询性能。
相关推荐
amao99881 小时前
数据库--dataset design
数据库
山沐与山1 小时前
【数据库】PostgreSQL架构与索引深度剖析
数据库·postgresql·架构
不穿格子的程序员2 小时前
Redis篇6——Redis深度剖析:从单机到集群,Redis高可用进化史
数据库·redis·集群·主从·高可用·哨兵
阿坤带你走近大数据2 小时前
什么是元数据管理?(附具体实施方案供参考)
数据库·金融
俊男无期2 小时前
超效率工作法
java·前端·数据库
2301_823438022 小时前
【无标题】解析《采用非对称自玩实现强健多机器人群集的深度强化学习方法》
数据库·人工智能·算法
中国胖子风清扬2 小时前
SpringAI和 Langchain4j等 AI 框架之间的差异和开发经验
java·数据库·人工智能·spring boot·spring cloud·ai·langchain
计算机学姐2 小时前
基于php的摄影网站系统
开发语言·vue.js·后端·mysql·php·phpstorm
Elastic 中国社区官方博客3 小时前
Elasticsearch:你是说,用于混合搜索(hybrid search)
大数据·数据库·人工智能·elasticsearch·搜索引擎·ai·全文检索
计算机学姐3 小时前
基于php的旅游景点预约门票管理系统
开发语言·后端·mysql·php·phpstorm