【SQL 中的分组查询与联合查询详解】

文章目录

  • [SQL 中的分组查询与联合查询详解](#SQL 中的分组查询与联合查询详解)
    • [1. GROUP BY分组查询](#1. GROUP BY分组查询)
      • [1.1 语句格式](#1.1 语句格式)
      • [1.2 示例说明](#1.2 示例说明)
        • [1.2.1 分别查询哥哥组和弟弟组的英语成绩总和](#1.2.1 分别查询哥哥组和弟弟组的英语成绩总和)
        • [1.2.2 查询哥哥组的所有成绩总和](#1.2.2 查询哥哥组的所有成绩总和)
    • [2. 联合查询](#2. 联合查询)
      • [2.1 内连接](#2.1 内连接)
        • [2.1.1 语法格式](#2.1.1 语法格式)
        • [2.1.2 执行过程](#2.1.2 执行过程)
      • [2.2 外连接](#2.2 外连接)
        • [2.2.1 左外连接](#2.2.1 左外连接)
        • [2.2.2 右外连接](#2.2.2 右外连接)
      • [2.3 自连接](#2.3 自连接)
      • [2.4 子查询](#2.4 子查询)
        • [2.4.1 单行子查询](#2.4.1 单行子查询)
        • [2.4.2 多行子查询](#2.4.2 多行子查询)
      • [2.5 合并查询](#2.5 合并查询)
        • [2.5.1 显示去重](#2.5.1 显示去重)
        • [2.5.2 不显示去重](#2.5.2 不显示去重)
      • [2.6 一条SQL语句的执行顺序](#2.6 一条SQL语句的执行顺序)

SQL 中的分组查询与联合查询详解

在数据库操作中,GROUP BY分组查询和联合查询是非常强大且常用的功能,它们能够帮助我们从大量数据中提取有价值的信息。本文将深入探讨这两种查询方式,并结合具体示例进行详细讲解。

1. GROUP BY分组查询

1.1 语句格式

GROUP BY语句的基本格式如下:

sql 复制代码
SELECT
    分组列的列名,
    除分组列的列名之外只能使用聚合函数
FROM
    查询表的表名
GROUP BY
    分组列的列名
HAVING
    HAVING子句:对GROUP BY的结果进行过滤(只能和GROUP BY一起使用)

在这个语句中,SELECT关键字用于指定要查询的列,其中除了分组列之外,其他列必须使用聚合函数(如SUMAVGCOUNT等)。FROM关键字指定要查询的表。GROUP BY关键字用于指定按照哪一列进行分组。HAVING子句则用于对分组后的结果进行进一步的筛选。

1.2 示例说明

假设有如下所示的exam表:

1.2.1 分别查询哥哥组和弟弟组的英语成绩总和
sql 复制代码
SELECT
    exam.`group`, 
    SUM(exam.english)
FROM
    exam AS exam
GROUP BY
    exam.`group`

在这个查询中,我们使用GROUP BY将数据按照group列进行分组,然后使用SUM聚合函数计算每个组的英语成绩总和。执行结果如下:

1.2.2 查询哥哥组的所有成绩总和
sql 复制代码
SELECT
    exam.`group`,
    SUM( exam.english +exam.chinese+exam.math) 
FROM
    exam AS exam 
GROUP BY
    exam.`group` 
HAVING
    exam.`group` ='哥哥组'

这里同样使用GROUP BY进行分组,不过在SUM函数中计算了每个学生的所有科目成绩总和。HAVING子句用于筛选出group哥哥组的记录。执行结果如下:

通过这两个示例,我们可以看到GROUP BY分组查询在对数据进行分类统计时的强大功能。它能够根据指定的列将数据分组,并对每个组的数据进行聚合计算,从而得到我们需要的统计信息。

2. 联合查询

联合查询用于将多个查询结果合并在一起,常见的联合查询包括内连接、外连接、自连接、子查询和合并查询等。下面我们将逐一介绍这些联合查询的用法。

2.1 内连接

内连接是一种最常用的连接方式,它返回两个表中满足连接条件的所有行。

2.1.1 语法格式
sql 复制代码
select * from table1,table2 where table1.xx=table2.xx;

这是一种基于逗号分隔的表名和WHERE子句指定连接条件的写法。更标准的写法是使用JOIN关键字:

sql 复制代码
SELECT *
FROM table1
JOIN table2 ON table1.xx = table2.xx;
2.1.2 执行过程

内连接的执行过程可以分为以下几个步骤:

  1. 计算笛卡尔积 :首先计算参加表连接的两个表的笛卡尔积。例如,假设有qintianpeople表和qintiancommodity表,执行以下查询:
sql 复制代码
SELECT
    *
FROM
    qintianpeople,
    qintiancommodity

结果会得到两个表的笛卡尔积,即qintianpeople表中的每一行与qintiancommodity表中的每一行进行组合,结果集的行数为两个表行数的乘积。执行结果如下:

  1. 通过连接条件过滤无效数据:在笛卡尔积的基础上,通过连接条件过滤掉不满足条件的数据。例如:
sql 复制代码
SELECT
    *
FROM
    qintianpeople,
    qintiancommodity
WHERE
    qintianpeople.people_id = qintiancommodity.people_id

这里使用WHERE子句指定了连接条件,只有people_id相等的行才会被保留。执行结果如下:

  1. 加入查询条件得到想要的结果行:可以进一步添加查询条件来筛选出符合特定要求的行。例如:
sql 复制代码
SELECT
    *
FROM
    qintianpeople,
    qintiancommodity
WHERE
    qintianpeople.people_id = qintiancommodity.people_id AND
    qintianpeople.people_id>5

这里在连接条件的基础上,添加了qintianpeople.people_id>5的条件,进一步筛选出符合条件的行。执行结果如下:

  1. 精简列名得到最终想要查询的列:最后,可以根据需求选择需要显示的列,精简结果集。例如:
sql 复制代码
SELECT
    qintianpeople.people_id,
    people_name,
    commodity_name
FROM
    qintianpeople,
    qintiancommodity
WHERE
    qintianpeople.people_id = qintiancommodity.people_id AND
    qintianpeople.people_id>5

这个查询只选择了people_idpeople_namecommodity_name这几列,得到了更精简的结果。执行结果如下:

2.2 外连接

外连接分为左外连接和右外连接,它们的区别在于以哪个表为基准进行连接。

2.2.1 左外连接

语法格式

sql 复制代码
Select * from table1 left join table2 on table1.xx=table2.xx;

左外连接以左表为基准,左边的数据全部显示,右边的数据没有对应记录的显示为NULL。例如:

sql 复制代码
SELECT
    qintianpeople.people_id,
    people_name,
    commodity_name
FROM
    qintiancommodity
    LEFT JOIN
    qintianpeople
    ON 
        qintiancommodity.people_id = qintianpeople.people_id

执行结果如下:

2.2.2 右外连接

语法格式

sql 复制代码
Select * from table1 right join table2 on table1.xx=table2.xx;

右外连接以右表为基准,右边的数据全部显示,左边的数据没有对应记录的显示为NULL。例如:

sql 复制代码
SELECT
    qintianpeople.people_id,
    people_name,
    commodity_name
FROM
    qintiancommodity
    RIGHT JOIN
    qintianpeople
    ON 
        qintiancommodity.people_id = qintianpeople.people_id

执行结果如下:

2.3 自连接

自连接是指在同一个表上进行连接操作,它可以把行比较转化为列比较,在查询时可以使用WHERE进行过滤。

语法格式

sql 复制代码
select * from table1 t1,table1 t2 where t1.xx=t2.xx;

2.4 子查询

子查询是指在一个查询中嵌套另一个查询,将内层查询的结果作为外层查询的条件。子查询可以分为单行子查询和多行子查询。

2.4.1 单行子查询

语法格式

sql 复制代码
Select * from table1 where id=(select id from table2 where...);

例如,假设有customers表和orders表,我们想要查询下了订单的客户信息,可以使用如下子查询:

sql 复制代码
SELECT *
FROM customers
WHERE customer_id IN (SELECT DISTINCT customer_id FROM orders);

这个子查询先从orders表中获取所有下过订单的customer_id,然后外层查询从customers表中查询这些customer_id对应的客户信息。

2.4.2 多行子查询

语法格式

sql 复制代码
Select * from table1 where id in (select id from table2 where...);

多行子查询与单行子查询类似,不过它返回的是多个值,使用IN关键字来匹配这些值。例如:

sql 复制代码
SELECT *
FROM products
WHERE product_id IN (SELECT product_id FROM order_items WHERE quantity > 10);

这个查询会返回在order_items表中被订购数量大于10的所有产品信息。

子查询可以多次嵌套,以实现更复杂的查询逻辑。例如:

sql 复制代码
SELECT *
FROM customers
WHERE customer_id IN (
    SELECT customer_id
    FROM orders
    WHERE order_date > '2023-01-01' AND customer_id IN (
        SELECT customer_id
        FROM customers
        WHERE region = 'Asia'
    )
);

这个嵌套子查询首先筛选出亚洲地区的客户customer_id,然后在这些客户中筛选出在2023年1月1日之后下过订单的客户customer_id,最后查询出这些客户的详细信息。

2.5 合并查询

合并查询用于将两个或多个查询的结果合并到一个结果集中,分为去重合并和不去重合并。

2.5.1 显示去重

语法格式

sql 复制代码
select * from table1 union select * from table2;

UNION关键字会将两个查询结果合并,并去除重复的行。

2.5.2 不显示去重

语法格式

sql 复制代码
select * from table1 union all select * from table2;

UNION ALL关键字会将两个查询结果直接合并,保留所有的行,包括重复的行。

2.6 一条SQL语句的执行顺序

了解一条SQL语句的执行顺序对于编写高效准确的查询非常重要。SQL语句的执行顺序如下:

  1. FROM:指定需要查询的表。
  2. JOIN ON:取笛卡尔积并根据连接条件进行连接。
  3. WHERE:使用限制条件过滤数据。
  4. GROUP BY:对数据进行分组查询。
  5. HAVING:对分组后的结果进行过滤。
  6. SELECT:筛选需要显示的列。
  7. DISTINCT:对结果进行去重(如果有该关键字)。
  8. ORDER BY:对结果进行排序。
  9. LIMIT:限制返回的行数。
相关推荐
m0_748239831 分钟前
深入了解Text2SQL开源项目(Chat2DB、SQL Chat 、Wren AI 、Vanna)
人工智能·sql·开源
dal118网工任子仪2 分钟前
40,【5】CTFHUB WEB SQL 时间盲注
数据库
凌龍墨5 分钟前
SQL 递归 ---- WITH RECURSIVE 的用法
数据库·sql·mysql·回归
对自己不够狠7 分钟前
SQL ON与WHERE区别
数据库·sql
weisian1517 分钟前
Mysql--实战篇--连接泄漏问题(什么是连接泄漏,未关闭SqlSession,长事务处理,连接池管理等)
数据库·mysql
doubt。8 分钟前
【BUUCTF】[GXYCTF2019]BabySQli
网络·数据库·笔记·sql·mysql·安全·web安全
XinShun41 分钟前
sqlalchemy The transaction is active - has not been committed or rolled back.
前端·数据库·python
draymond710743 分钟前
redis-排查命中率降低问题
数据库·redis·缓存
dal118网工任子仪1 小时前
51,【1】BUUCTF WEB GxYCTF2019babysqli
数据库·sql
无限大.1 小时前
从零开始学数据库 day2 DML
数据库·oracle