mysql之过滤分组

在MySQL中,过滤分组数据通常使用 GROUP BY 结合 HAVING 子句和 WHERE 子句。GROUP BY 子句用于将结果集按一个或多个列进行分组,而 HAVING 子句用于过滤分组后的数据。WHERE 子句用于过滤分组前的数据。下面是具体的用法和示例:

GROUP BY 子句

GROUP BY 子句用于根据一个或多个列对结果集进行分组。通常结合聚合函数(如 COUNTSUMAVGMAXMIN)使用。

基本语法
sql 复制代码
SELECT column1, column2, aggregate_function(column3)
FROM table_name
WHERE condition
GROUP BY column1, column2
ORDER BY column1, column2;

示例

  1. 按部门分组统计员工人数
sql 复制代码
SELECT department_id, COUNT(*) AS employee_count
FROM employees
GROUP BY department_id;

HAVING 子句

HAVING 子句用于过滤分组后的数据。它的作用类似于 WHERE 子句,但 WHERE 子句是在分组前过滤记录,而 HAVING 子句是在分组后过滤记录。

基本语法
sql 复制代码
SELECT column1, column2, aggregate_function(column3)
FROM table_name
WHERE condition
GROUP BY column1, column2
HAVING aggregate_function(column3) condition
ORDER BY column1, column2;

示例

  1. 按部门分组统计员工人数,并只显示员工人数超过5人的部门
sql 复制代码
SELECT department_id, COUNT(*) AS employee_count
FROM employees
GROUP BY department_id
HAVING COUNT(*) > 5;
  1. 按部门分组统计员工平均工资,并只显示平均工资高于5000的部门
sql 复制代码
SELECT department_id, AVG(salary) AS average_salary
FROM employees
GROUP BY department_id
HAVING AVG(salary) > 5000;

结合 WHEREHAVING

WHERE 子句和 HAVING 子句可以一起使用,WHERE 子句用于过滤原始数据,HAVING 子句用于过滤分组后的数据。

示例
  1. 在计算平均工资前过滤掉工资低于3000的员工,并按部门分组统计员工平均工资,只显示平均工资高于5000的部门
sql 复制代码
SELECT department_id, AVG(salary) AS average_salary
FROM employees
WHERE salary >= 3000
GROUP BY department_id
HAVING AVG(salary) > 5000;

复杂示例

以下是一个更复杂的示例,展示了如何结合使用 GROUP BYHAVING 和聚合函数来进行数据分析:

  1. 统计每个部门的员工人数、平均工资和最高工资,并只显示员工人数超过10且平均工资高于4000的部门
sql 复制代码
SELECT department_id,
       COUNT(*) AS employee_count,
       AVG(salary) AS average_salary,
       MAX(salary) AS max_salary
FROM employees
GROUP BY department_id
HAVING COUNT(*) > 10 AND AVG(salary) > 4000;

注意事项

  • WHEREHAVING 的区别WHERE 用于过滤原始数据行,HAVING 用于过滤分组后的数据行。
  • 使用聚合函数HAVING 子句通常用于包含聚合函数的条件过滤。
  • 性能考虑 :在大型数据集上,尽量先使用 WHERE 子句进行初步过滤,以减少分组和聚合的数据量,从而提高查询性能。
相关推荐
直有两条腿20 分钟前
【数据迁移】HBase Bulkload批量加载原理
大数据·数据库·hbase
言之。41 分钟前
ClickHouse 数据更新策略深度解析:突变操作与最佳实践
服务器·数据库·clickhouse
m0_64880493_江哥1 小时前
用正则方法从中英文本提取英文的python示例
python·mysql·正则表达式
白衣鸽子2 小时前
数据库高可用设计的灵魂抉择:CAP权衡
数据库·后端
九皇叔叔2 小时前
Linux Shell 正则表达式:从入门到实战,玩转文本匹配与处理
linux·mysql·正则表达式
DokiDoki之父3 小时前
Mybatis—入门 & (配置)SQL提示和日志输出
数据库·sql·mybatis
Wang's Blog4 小时前
MySQL: 高并发电商场景下的数据库架构演进与性能优化实践
mysql·性能优化·数据库架构
TDengine (老段)4 小时前
TDengine 数据函数 LN 用户手册
大数据·数据库·物联网·时序数据库·tdengine·涛思数据
机灵猫4 小时前
Redis 在订单系统中的实战应用:防重、限流与库存扣减
数据库·redis·缓存
木易2.04 小时前
从零构建RAG知识库管理系统(二)
数据库·oracle