**一、**数据类型
1****数据类型分类

2****数值类型

2.1 tinyint****类型
数值越界测试:
mysql> create table t1(num tinyint);
Query OK, 0 rows affected (0.02 sec)
mysql> insert into t1 values(1);
Query OK, 1 row affected (0.00 sec)
mysql> insert into t1 values(128); -- 越界插入,报错
ERROR 1264 (22003): Out of range value for column 'num' at row 1
mysql> select * from t1;

说明:
-
在MySQL中,整型可以指定是有符号的和无符号的,默认是有符号的。
-
可以通过UNSIGNED来说明某个字段是无符号的
-
无符号案例
mysql> create table t2(num tinyint unsigned);
mysql> insert into t2 values(-1); -- 无符号,范围是: 0 - 255
ERROR 1264 (22003): Out of range value for column 'num' at row 1
mysql> insert into t2 values(255);
Query OK, 1 row affected (0.02 sec)
mysql> select * from t2;

- 其他类型自己推导
注意:尽量不使用unsigned,对于int类型可能存放不下的数据,int unsigned同样可能存放不
下,与其如此,还不如设计时,将int类型提升为bigint类型。
2.2 bit****类型
基本语法:
bit[(M)] : 位字段类型。M表示每个值的位数,范围从1到64。如果M被忽略,默认为1。
举例:

现象:插入十进制数字 10,不会直接显示 10,新版客户端默认展示十六进制 0x0A(老版本客户端会按 ASCII 字符展示空白,新版规则变更)
BIT 字段显示规则说
- 存储逻辑 :写入十进制数字 → MySQL 自动转为对应 8 位二进制保存(10→
00001010) - 新版客户端规则 :开启
binary-as-hex参数,BIT 二进制数据默认以十六进制格式展示 - 老版本规则:无十六进制转换,按 ASCII 码值解析字符

- 十进制 65 二进制:
01000001 - 老版本查询:a 列显示
A(ASCII 码 65 对应字符 A) - 当前新版查询 :a 列显示
0x41
想要查看原始十进制 / 二进制写法

bit (1):仅存储 0/1,超范围报错

2.3****小数类型
2.3.1 float
语法:
float[(m, d)] [unsigned] : M指定显示长度,d指定小数位数,占用空间4个字节
案例:
小数:float(4,2)表示的范围是-99.99 ~ 99.99,MySQL在保存值时会进行四舍五入。

案例:
如果定义的是float(4,2) unsigned 这时,因为把它指定为无符号的数,范围是 0 ~ 99.99

2.3.2 decimal
语法:
decimal(m, d) [unsigned] : 定点数m指定长度,d表示小数点的位数
- decimal(5,2) 表示的范围是 -999.99 ~ 999.99
- decimal(5,2) unsigned 表示的范围 0 ~ 999.99
decimal和float很像,但是有区别:
float和decimal表示的精度不一样

说明:float表示的精度大约是7位。
decimal整数最大位数m为65。支持小数最大位数d是30。如果d被省略,默认为0.如果m被省略,
默认是10。
小数不够规定位数才补 0,小数多了舍入、整数多了报错
建议:如果希望小数的精度高,推荐使用decimal。
3.字符串类型
3.1 char
语法:
char(L): 固定长度字符串,L是可以存储的长度,单位为字符,最大长度值可以为255
案例(char):

说明:
char(2) 表示可以存放两个字符,可以是字母或汉字,但是不能超过2个, 最多只能是255

3.2 varchar
语法:
varchar(L): 可变长度字符串,L表示字符长度,最大长度65535个字节
案例:

说明:
关于varchar(len),len到底是多大,这个len值,和表的编码密切相关:
- varchar长度可以指定为0到65535之间的值,但是有1 - 3 个字节用于记录数据大小,所以说有效字节数是65532。
- 当我们的表的编码是utf8时,varchar(n)的参数n最大值是65532/3=21844因为utf中,一个字符占用3个字节,如果编码是gbk,varchar(n)的参数n最大是65532/2=32766(因为gbk中,一个字符占用2字节)。

3.3 char和varchar****比较

如何选择定长或变长字符串?
- 如果数据确定长度都一样,就使用定长(char),比如:身份证,手机号,md5
- 如果数据长度有变化,就使用变长(varchar), 比如:名字,地址,但是你要保证最长的能存的进去。
- 定长的磁盘空间比较浪费,但是效率高。
- 变长的磁盘空间比较节省,但是效率低。
- 定长的意义是,直接开辟好对应的空间
- 变长的意义是,在不超过自定义范围的情况下,用多少,开辟多少。
**4.**日期和时间类型
常用的日期有如下三个:
- date :日期 'yyyy-mm-dd' ,占用三字节
- datetime 时间日期格式 'yyyy-mm-dd HH:ii:ss' 表示范围从 1000 到 9999 ,占用八字节
- timestamp :时间戳,从1970年开始的 yyyy-mm-dd HH:ii:ss 格式和 datetime 完全一致,占用四字节
案例:

新版本 MySQL (5.7/8.0):只写 t3 timestamp → 默认允许为空、无默认值,插入没给值就存 NULL 老版本 5.5:第一个 timestamp 不加默认,自动默认当前时间,不空
t3 自动带出此刻时间,不再 NULL。
两种常用写法
-
只新增自动填时间(创建时间)
t3 timestamp default current_timestamp -
新增自动填 + 修改数据自动刷新时间(更新时间)
t3 timestamp default current_timestamp on update current_timestamp

这里我们更新数据,但是我们t3的时间没有更新

我们把t3修改为 t3 timestamp default current_timestamp on update current_timestamp就自动更新了

5.enum和set
语法:
- enum:枚举,"单选"类型;
enum('选项1','选项2','选项3',...);
该设定只是提供了若干个选项的值,最终一个单元格中,实际只存储了其中一个值;而且出于效率考虑,这些值实际存储的是"数字",因为这些选项的每个选项值依次对应如下数字:1,2,3,....最多65535 个;当我们添加枚举值时,也可以添加对应的数字编号。
set:集合,"多选"类型;
set('选项值1','选项值2','选项值3', ...);
SET 类型预先定义好多个可选值,一条数据能勾选多个选项;内部不存文本,每个选项对应 1、2、4、8......2 的次方数字,多选就数值相加存一个整数,最多支持 64 个可选项目。
说明:不建议在添加枚举值,集合值的时候采用数字的方式,因为不利于阅读
案例:
有一个调查表votes,需要调查人的喜好, 比如(登山,游泳,篮球,武术)中去选择(可以多选),(男,女)单选

enum可以通过下标来进行访问默认从1开始
MySQL 的
SET是一种多选字符串类型 ,它的核心设计是通过二进制位(bit)来存储、判断与访问选项,而不是普通的顺序数字下标。简单说:SET 的每一个选项,对应一个二进制位;选中多个选项,就是多个位的叠加。
举例最清楚
SET ('登山','游泳','篮球','武术')
- 登山 → 第 1 位 → 1
- 游泳→ 第 2 位 → 2
- 篮球 → 第 3 位 → 4
- 武术 → 第 4 位 → 8
同时选 登山 + 武术
二进制:
1001数字 = 1 + 8 = 9同时选 游泳 + 篮球
二进制:
0110数字 = 2 + 4 = 6
有如下数据,想查找所有喜欢登山的人:

使用如下查询语句

不能查询出所有,爱好为登山的人。
集合查询使用find_ in_ set函数:
find_in_set(sub,str_list) :如果 sub 在 str_list 中,则返回下标;如果不在,返回0;str_list 用逗号分隔的字符串。

FIND_IN_SET('a,b','a,b,c')返回 0:a,b被当作整体,列表拆分是 a、b、c,无该项。 单次只查单个项,查 a 下标 1、查 b 下标 2,多用于筛选 SET 字段。
查询爱好登山的人:

二、表的约束
真正约束字段的是数据类型,但是数据类型约束很单一,需要有一些额外的约束,更好的保证数据的合****法性,从业务逻辑角度保证数据的正确性。比如有一个字段是email,要求是唯一的。
表的约束很多,这里主要介绍如下几个: null/not null,default, comment, zerofill,primary
key,auto_increment,unique key 。
表的约束:表中一定要有各种约束,通过约束,让我们未来插入数据库表中的数据
是符合预期的。约束本质是通过技术手段,倒逼程序员,插入正确的数据。反过来,站在mysql的视角,凡是插入进来的数据,都是符合数据约束的!
约束的最终目标:保证数据的完整性和可预期性
**1.**空属性
- 两个值:null(默认的)和not null(不为空)
- 数据库默认字段基本都是字段为空,但是实际开发时,尽可能保证字段不为空,因为数据为空没办法参与运算。

案例:
创建一个班级表,包含班级名和班级所在的教室。
站在正常的业务逻辑中:
- 如果班级没有名字,你不知道你在哪个班级
- 如果教室名字可以为空,就不知道在哪上课
所以我们在设计数据库表的时候,一定要在表中进行限制,满足上面条件的数据就不能插入到表中。这就是"约束"。

**2.**默认值
默认值:某一种数据会经常性的出现某个具体的值,可以在一开始就指定好,在需要真实数据的时候,用户可以选择性的使用默认值。

默认值的生效:数据在插入的时候不给该字段赋值,就使用默认值


--注意:只有设置了default的列,才可以在插入值的时候,对列进行省略
NOT NULL + DEFAULT 组合总结
- 手动填有效值:优先存入用户填写的数据,默认值失效。
- 插入省略该字段 :自动填入预设的
DEFAULT默认值,满足NOT NULL非空约束。- 手动插入 NULL :被
NOT NULL拦截,直接报错,无法存入空值。- 仅 NOT NULL、无 DEFAULT:插入省略字段时,无值填充直接报错
一句话精简:NOT NULL 禁止存空,DEFAULT 缺省补值,二者搭配保证字段永远有有效数据。
**3.**列描述
列描述:comment,没有实际含义,专门用来描述字段,会根据表创建语句保存,用来给程序员或DBA (数据库管理员)来进行了解。

--注意:not null和defalut一般不需要同时出现,因为default本身有默认值,不会为空
通过desc查看不到注释信息:

通过show可以看到:

4.zerofill
刚开始学习数据库时,很多人对数字类型后面的长度很迷茫。通过show看看t16表的建表语句:
创建 t16 数据表,a、b 字段为 int (10) 无符号,引擎 MyISAM、字符集 gbk,无 zerofill 时 int (10) 仅标注、不控制展示长度。
a添加了zerofill属性

插入数据 1、2,在进行查询

这次可以看到a的值插入的1变成00001,这就是zerofill属性的作用,如果宽度小于设定的宽度(这里设置的是5),自动填充0。要注意的是,这只是最后显示的结果,在MySQL中实际存储的还是1。为什么是这样呢?我们可以用hex函数来证明。

HEX (a):把 a 字段真实数值转为十六进制,验证底层存储没变,zerofill 只改页面展示。
可以看出数据库内部存储的还是1,00001只是设置了zerofill属性后的一种格式化输出而已。
**5.**主键
主键:primary key用来唯一的约束该字段里面的数据,不能重复,不能为空,一张表中最多只能有一个主键;主键所在的列通常是整数类型。
案例:
- 创建表的时候直接在字段上指定主键

- 主键约束:主键对应的字段中不能重复,一旦重复,操作失败。

-
当表创建好以后但是没有主键的时候,可以再次追加主键
alter table 表名 add primary key(字段列表)

-
删除主键
alter table 表名 drop primary key;

- 复合主键
在创建表的时候,在所有字段之后,使用primary key(主键字段列表)来创建主键,如果有多个字段
作为主键,可以使用复合主键

t20 为学生选课成绩表,id(学生编号)、course(课程代码)共同组成复合主键。
- 约束规则 :id、course 两个字段均不允许为空;字段单独数据可重复,但id 与 course 的组合值不能重复。
- 业务逻辑 :一名学生可以选修多门课程,同一个课程能被多名学生选择,但一名学生不能重复选修同一门课。
- 数据验证:录入 (1,'123') 可以保存;再次录入 (1,'123'),因字段组合重复,数据库报错无法插入;(1,'456')、(2,'123') 均可正常录入。
- 补充:一张表仅有一个主键,多字段合并做主键即为复合主键。
**6.**自增长
auto_increment:当对应的字段,不给值,会自动的被系统触发,系统会从当前字段中已经有的最大值 +1操作,得到一个新的不同的值。通常和主键搭配使用,作为逻辑主键。
自增长的特点:
- 任何一个字段要做自增长,前提是本身是一个索引(key一栏有值)
- 自增长字段必须是整数
- 一张表最多只能有一个自增长
案例:

在插入后获取上次插入的 AUTO_INCREMENT 的值(批量插入获取的是第一个值)

索引:
在关系数据库中,索引是一种单独的、物理的对数据库表中一列或多列的值进行排序的一种存储结
构,它是某个表中一列或若干列值的集合和相应的指向表中物理标识这些值的数据页的逻辑指针清单。 索引的作用相当于图书的目录,可以根据目录中的页码快速找到所需的内容。
索引提供指向存储在表的指定列中的数据值的指针,然后根据您指定的排序顺序对这些指针排序。
数据库使用索引以找到特定值,然后顺指针找到包含该值的行。这样可以使对应于表的SQL语句执行得更快,可快速访问数据库表中的特定信息。
**7.**唯一键
一张表中有往往有很多字段需要唯一性,数据不能重复,但是一张表中只能有一个主键:唯一键就可以解决表中有多个字段需要唯一性约束的问题。
唯一键的本质和主键差不多,唯一键允许为空,而且可以多个为空,空字段不做唯一性比较。
关于唯一键和主键的区别:
我们可以简单理解成,主键更多的是标识唯一性的。而唯一键更多的是保证在业务上,不要和别的信息出现重复。乍一听好像没啥区别,我们举一个例子
假设一个场景(当然,具体可能并不是这样,仅仅为了帮助大家理解)
比如在公司,我们需要一个员工管理系统,系统中有一个员工表,员工表中有两列信息,一个身份证号码,一 个是员工工号,我们可以选择身份号码作为主键。
而我们设计员工工号的时候,需要一种约束:而所有的员工工号都不能重复。
具体指的是在公司的业务上不能重复,我们设计表的时候,需要这个约束,那么就可以将员工工号设计成为唯 一键。
一般而言,我们建议将主键设计成为和当前业务无关的字段,这样,当业务调整的时候,我们可以尽量不会对
主键做过大的调整。
案例:
**8.**外键
外键用于定义主表和从表之间的关系:外键约束主要定义在从表上,主表则必须是有主键约束或unique 约束。当定义外键后,要求外键列数据必须在主表的主键列存在或为null。
语法:
foreign key (字段名) references 主表(列)
案例:

对上面的示意图进行设计:
- 先创建主键表

- 再创建从表

- 正常插入数据


- 插入一个班级号为30的学生,因为没有这个班级,所以插入不成功

- 插入班级id为null,比如来了一个学生,目前还没有分配班级

- 如何理解外键约束
首先我们承认,这个世界是数据很多都是相关性的。
理论上,上面的例子,我们不创建外键约束,就正常建立学生表,以及班级表,该有的字段我们都有。
此时,在实际使用的时候,可能会出现什么问题?
有没有可能插入的学生信息中有具体的班级,但是该班级却没有在班级表中?
比如比特只开了比特100班,比特101班,但是在上课的学生里面竟然有比特102班的学生(这个班目前并不存在),这很明显是有问题的。
因为此时两张表在业务上是有相关性的,但是在业务上没有建立约束关系,那么就可能出现问题。
解决方案就是通过外键完成的。建立外键的本质其实就是把相关性交给mysql去审核了,提前告诉mysql表之间的约束关系,那么当用户插入不符合业务逻辑的数据的时候,mysql不允许你插入。
总结
- 仅字段命名关联(无外键约束) :stu 表
class_id和 myclass 表id只是名字逻辑挂钩,无强制约束
- 弊端:①能插入不存在班级编号的学生;②能直接删除还有在读学生的班级。
- 添加外键约束规则 :外键约束加在从表(stu) ,绑定
class_id → myclass.id,启用数据约束:
- 插入学生:
class_id必须在班级主键里存在,不存在直接报错 1452;- 删除班级:班级下有学生时,无法直接删父表数据。
**9.综合案例-**阅读
有一个商店的数据,记录客户及购物情况,有以下三个表组成:
- 商品goods(商品编号goods_id,商品名goods_name, 单价unitprice, 商品类别category, 供应商 provider)
- 客户customer(客户号customer_id,姓名name,住址address,邮箱email,性别sex,身份证card_id)
- 购买purchase(购买订单号order_id,客户号customer_id,商品号goods_id,购买数量nums)
要求:
- 每个表的主外键
- 客户的姓名不能为空值
- 邮箱不能重复
- 客户的性别(男,女)
SQL:
--商品

--客户

--购买

good:主表 (父表)
customer:主表(父表)
purchase:从表(子表)
核心思想:不要重复存储数据,而是用"引用"的方式关联。
商品信息(名称、单价、供应商)只存一次在
goods表里客户信息(姓名、地址、邮箱)只存一次在
customer表里订单只需要存:
哪个客户买的 →
customer_id哪个商品 →
goods_id买几个 →
nums这样既节省空间,又避免数据不一致
带来的约束
✅ 插入订单时:客户和商品必须提前存在
❌ 删除客户时:如果该客户有订单,会被阻止(除非先删订单)
❌ 删除商品时:如果该商品被买过,会被阻止
这就是从表依赖主表的体现。
生活中的类比
你可以先有客户、先有商品
但你不能在没有客户的情况下开一张小票
小票上的客户编号、商品编号,必须真实对应到已经存在的客户和商品
三、表的增删改查
CRUD : Create(创建), Retrieve(读取),Update(更新),Delete(删除)
1.Create
语法:
INSERT [INTO] table_name
[(column [, column] ...)]
VALUES (value_list) [, (value_list)] ...
value_list: value, [, value] ...
案例:
-- 创建一张学生表
CREATE TABLE students (
id INT UNSIGNED PRIMARY KEY AUTO_INCREMENT,
sn INT NOT NULL UNIQUE COMMENT '学号',
name VARCHAR(20) NOT NULL,
qq VARCHAR(20)
);
**1.1单行数据+**全列插入
-- 插入两条记录,value_list 数量必须和定义表的列的数量及顺序一致
-- 注意,这里在插入的时候,也可以不用指定id(当然,那时候就需要明确插入数据到那些列了),那么mysql会使用默认的值进行自增。
INSERT INTO students VALUES (100, 10000, '唐三藏', NULL);
-- 查看插入结果
SELECT * FROM students;
**1.2多行数据+**指定列插入
-- 插入两条记录,value_list 数量必须和指定列数量及顺序一致
INSERT INTO students (id, sn, name) VALUES
(102, 20001, '曹孟德'),
(103, 20002, '孙仲谋');
1.3****插入否则更新
由于 主键或者 唯一键对应的值已经存在而导致插入失败
-- 主键冲突

-- 唯一键冲突

可以选择性的进行同步更新操作语法:
INSERT ... ON DUPLICATE KEY UPDATE
column = value [, column = value] ...

-- 0 row affected: 表中有冲突数据,但冲突数据的值和 update 的值相等
-- 1 row affected: 表中没有冲突数据,数据被插入
-- 2 row affected: 表中有冲突数据,并且数据已经被更新
-- 通过 MySQL 函数获取受到影响的数据行数
-- ON DUPLICATE KEY 当发生重复key的时候直接覆盖
1.4****替换
-- 主键 或者 唯一键 没有冲突,则直接插入;
-- 主键 或者 唯一键 如果冲突,则删除后再插入

-- 1 row affected: 表中没有冲突数据,数据被插入
-- 2 row affected: 表中有冲突数据,删除后重新插入
2.Retrieve
语法:
SELECT
[DISTINCT] {* | {column [, column] ...}
[FROM table_name]
[WHERE ...]
[ORDER BY column [ASC | DESC], ...]
LIMIT ...
案例:

2.1 SELECT****列
2.1.1****全列查询
-- 通常情况下不建议使用 * 进行全列查询
-- 1. 查询的列越多,意味着需要传输的数据量越大;
-- 2. 可能会影响到索引的使用。

2.1.2****指定列查询
指定列的顺序不需要按定义表的顺序来

2.1.3****查询字段为表达式
表达式不包含字段

表达式包含一个字段

表达式包含多个字段

2.1.4****为查询结果指定别名
语法:
SELECT column [AS] alias_name [...] FROM table_name;

2.1.5****结果去重
98 分重复了

去重结果

2.2 WHERE****条件
比较运算符:

逻辑运算符:

案例:
2.2.1英语不及格的同学及英语成绩( < 60 )

**2.2.2语文成绩在80, 90**分的同学及语文成绩

使用 BETWEEN ... AND ... 条件

2.2.3数学成绩是58或者59或者98或者99****分的同学及数学成绩

使用 IN 条件

2.2.4****姓孙的同学 及 孙某同学
% 匹配任意多个(包括 0 个)任意字符

_ 匹配严格的一个任意字符

2.2.5****语文成绩好于英语成绩的同学

2.2.6总分在200****分以下的同学

2.2.7语文成绩> 80****并且不姓孙的同学
AND 与 NOT 的使用

2.2.8孙某同学,否则要求总成绩> 200并且 语文成绩<数学成绩 并且 英语成绩> 80
综合性查询

2.2.9 NULL****的查询
查询 students 表

查询 qq 号已知的同学姓名

NULL 和 NULL 的比较,= 和 <=> 的区别

2.3****结果排序
语法:
-- ASC 为升序(从小到大)
-- DESC 为降序(从大到小)
-- 默认为 ASC
SELECT ... FROM table_name [WHERE ...]
ORDER BY column [ASC|DESC], [...];
注意:没有ORDER BY子句的查询,返回的顺序是未定义的,永远不要依赖这个顺序
案例:
2.3.1****同学及数学成绩,按数学成绩升序显示

默认排序是升序
2.3.2同学及qq号,按qq****号排序显示
2.3.3****查询同学各门成绩,依次按 数学降序,英语升序,语文升序的方式显示
多字段排序,排序优先级随书写顺序

2.3.4****查询同学及总分,由高到低
ORDER BY 中可以使用表达式

ORDER BY 子句中可以使用列别名

2.3.5****查询姓孙的同学或者姓曹的同学数学成绩,结果按数学成绩由高到低显示
结合 WHERE 子句 和 ORDER BY 子句

2.4****筛选分页结果
语法:
-- 起始下标为 0
-- 从 s 开始,筛选 n 条结果
SELECT ... FROM table_name [WHERE ...] [ORDER BY ...] LIMIT s, n
-- 从 0 开始,筛选 n 条结果
SELECT ... FROM table_name [WHERE ...] [ORDER BY ...] LIMIT n;
;
-- 从 s 开始,筛选 n 条结果,比第二种用法更明确,建议使用
SELECT ... FROM table_name [WHERE ...] [ORDER BY ...] LIMIT n OFFSET s;
建议:对未知表进行查询时,最好加一条LIMIT 1,避免因为表中数据过大,查询全表数据导致数据库卡死
按id进行分页,每页3条记录,分别显示 第1、2、3页
第 1 页

第 2 页

第 3 页 如果结果不足 3 个,不会有影响

3 Update
语法:
UPDATE table_name SET column = expr [, column = expr ...]
[WHERE ...] [ORDER BY ...] [LIMIT ...]
对查询到的结果进行列值更新
案例:
3.1将孙悟空同学的数学成绩变更为80****分
3.2将曹孟德同学的数学成绩变更为60分,语文成绩变更为70****分
一次更新多个列

3.3将总成绩倒数前三的3位同学的数学成绩加上30****分

按总成绩排序后查询结果

3.4将所有同学的语文成绩更新为原来的2****倍
注意:更新全表的语句慎用!
没有 WHERE 子句,则更新全表
查看原数据

4.Delete
4.1****删除数据
语法:
DELETE FROM table_name [WHERE ...] [ORDER BY ...] [LIMIT ...]
案例:
4.1.1****删除孙悟空同学的考试成绩

删除数据

4.1.2****删除整张表数据
注意:删除整表操作要慎用!

删除整表数据

DELETE 删数据,不动自增计数器,用过的 ID 不再回收,序号接续。
4.2****截断表
语法:
TRUNCATE [TABLE] table_name
注意:这个操作慎用
- 只能对整表操作,不能像 DELETE 一样针对部分数据操作;
- 实际上 MySQL 不对数据操作,所以比 DELETE 更快,但是TRUNCATE在删除数据的时候,并不经过真正的事物,所以无法回滚
- 会重置 AUTO_INCREMENT 项
截断整表数据,注意影响行数是 0,所以实际上没有对数据真正操作

查看表结构,会有 AUTO_INCREMENT=2 项

TRUNCATE 清空表,重置自增从 1 开始。
5****插入查询结果
语法:
INSERT INTO table_name [(column [, column ...])] SELECT ...
案例:删除表中的的重复复记录,重复的数据只能有一份


绿色框框
- 把原来的
duplicate_table改名叫old_duplicate_table(备份) - 把
no_duplicate_table改名叫duplicate_table(顶替上线)
**6.**聚合函数

案例:
6.1****统计班级共有多少同学
使用 * 做统计,不受 NULL 影响

使用表达式做统计

6.2统计班级收集的qq****号有多少
NULL 不会计入结果

6.3****统计本次考试的数学成绩分数个数

6.4****统计数学成绩总分

6.4****统计平均总分

6.5****返回英语最高分

6.6返回> 70****分以上的数学最低分

7. group by****子句的使用
在select中使用group by 子句可以对指定列进行分组查询
select column1, column2, .. from table group by column;
-- 创建表(关键字用小写)
create table employee (
id int,
name varchar(20),
dept_id varchar(10),
gender varchar(2),
position varchar(20),
salary int,
hire_date date
);
-- 插入数据
insert into employee values
(1, '张三', 'D01', '男', '工程师', 8000, '2023-01-15'),
(2, '李四', 'D01', '女', '工程师', 7500, '2023-03-20'),
(3, '王五', 'D01', '男', '高级工程师', 12000, '2022-06-10'),
(4, '赵六', 'D02', '女', '产品经理', 11000, '2022-09-01'),
(5, '周梅', 'D02', '女', '产品专员', 6000, '2024-02-10'),
(6, '吴刚', 'D03', '男', '销售经理', 10000, '2021-11-15'),
(7, '郑丽', 'D03', '女', '销售专员', 5500, '2024-01-20'),
(8, '孙强', 'D03', '男', '销售专员', 5800, '2023-08-05'),
(9, '陈敏', 'D04', '女', 'HRBP', 9000, '2022-04-18'),
(10, '林晨', 'D04', '男', '招聘专员', 5000, '2024-03-01'),
(11, '张伟', 'D01', '男', '工程师', 7800, '2023-07-12'),
(12, '刘芳', 'D02', '女', '产品专员', 6200, '2023-11-25');
1. 统计每个部门的人数

2.统计每个部门的平均工资(保留2位小数)

3.显示平均工资低于8000的部门和它的平均工资

原始表 employee (所有数据)
↓
【from】读取整张数据表
↓
【group by】按 dept_id 分组,分组完成立刻执行 avg(salary),每组算出平均值
组1 (D01):8000, 7500, 12000, 7800 → avg = 8825
组2 (D02):11000, 6000, 6200 → avg = 7733
组3 (D03):10000, 5500, 5800 → avg = 7100
组4 (D04):9000, 5000 → avg = 7000
↓
【having avg(salary) < 8000】用刚算完的均值筛选分组
D01:8825 < 8000? ❌ 剔除
D02:7733 < 8000? ✅ 保留
D03:7100 < 8000? ✅ 保留
D04:7000 < 8000? ✅ 保留
↓
【select】复用已经计算好的平均值,定义别名 avg_salary
D02 | 7733.33
D03 | 7100.00
D04 | 7000.00
WHERE vs HAVING
- WHERE:分组前筛原始数据 ,不能用聚合函数 (count/sum)
- HAVING:分组后筛分组结果 ,只能筛聚合结果
注意事项:
常见错误示例:
-- ❌ 错误:where 中用了别名 select dept_id, avg(salary) as avg_sal from employee where avg_sal > 5000 -- 报错!别名不存在 group by dept_id; 执行顺序:from → where → group by → 聚合运算 → having → select(创建字段别名) where执行时别名还未生成,无法使用avg_sal,报错。 -- ✅ 正确:having 中用聚合函数 select dept_id, avg(salary) as avg_sal from employee group by dept_id having avg(salary) > 5000; -- 正确能不能用别名完全由执行顺序决定
- WHERE :在 SELECT 之前执行→别名还没创建,不能用别名
- HAVING:在 SELECT 前、分组聚合后→可用聚合原值,MySQL 支持别名、标准 SQL 不推荐
- ORDER BY :在 SELECT 之后执行→别名已生成,随便用别名
order by 是在 select 生成别名之后,才开始执行的,所以可以随便用







