MySQL进阶-----order by优化和group by优化

目录

前言

[一、order by优化](#一、order by优化)

[二、group by优化](#二、group by优化)


前言

本期我们继续学习sql优化,其中分为order by 排序优化和group by分组优化。

数据准备:可以查阅此链接(MySQL 进阶-----索引使用规则-CSDN博客

一、order by****优化

MySQL 的排序,有两种方式:

  • Using filesort : 通过表的索引或全表扫描,读取满足条件的数据行,然后在排序缓冲区sort buffer中完成排序操作,所有不是通过索引直接返回排序结果的排序都叫 FileSort 排序。
  • Using index : 通过有序索引顺序扫描直接返回有序数据,这种情况即为 using index,不需要 额外排序,操作效率高。

对于以上的两种排序方式,Using index的性能高,而Using filesort的性能低,我们在优化排序
操作时,尽量要优化为 Using index。
接下来,我们来做一个测试:
当前tb_user 表索引情况:

A. 数据准备
把之前测试时,为 tb_user 表所建立的部分索引直接删除掉

sql 复制代码
drop index index_phone on tb_user;
drop index idx_user_phone_name on tb_user;
drop index index_name on tb_user;

B. 执行排序SQL

sql 复制代码
explain select id ,age ,phone from tb_user order by age;
sql 复制代码
explain select id,age,phone from tb_user order by age, phone ;

由于 age, phone 都没有索引,所以此时再排序时,出现Using filesort, 排序性能较低。

C. 创建索引

sql 复制代码
-- 创建索引
create index idx_age_phone on tb_user(age,phone);

D. 创建索引后,根据age, phone进行升序排序

sql 复制代码
explain select id,age,phone from tb_user order by age;
sql 复制代码
explain select id,age,phone from tb_user order by age , phone; 


建立索引之后,再次进行排序查询,就由原来的 Using filesort , 变为了 Using index ,性能
就是比较高的了。
E. 创建索引后,根据 age, phone 进行降序排序

sql 复制代码
explain select id,age,phone from tb_user order by age desc , phone desc ;


也出现 Using index , 但是此时 Extra 中出现了 Backward index scan ,这个代表反向扫描索
引,因为在 MySQL 中我们创建的索引,默认索引的叶子节点是从小到大排序的,而此时我们查询排序时,是从大到小,所以,在扫描时,就是反向扫描,就会出现 Backward index scan 。 在
MySQL8 版本中,支持降序索引,我们也可以创建降序索引。
F. 根据 phone , age 进行升序排序, phone 在前, age 在后

sql 复制代码
explain select id,age,phone from tb_user order by phone , age;


排序时 , 也需要满足最左前缀法则 , 否则也会出现 filesort 。因为在创建索引的时候, age 是第一个
字段, phone 是第二个字段,所以排序时,也就该按照这个顺序来,否则就会出现 Using filesort。
F-2. 根据 age, phone 进行降序一个升序,一个降序

sql 复制代码
explain select id,age,phone from tb_user order by age asc ,phone desc ;


因为创建索引时,如果未指定顺序,默认都是按照升序排序的(A是表示升序asc,D的话是表示降序desc),而查询时,一个升序,一个降序,此时就会出现Using filesort 。

为了解决上述的问题,我们可以创建一个索引,这个联合索引中 age 升序排序, phone 倒序排序。
G. 创建联合索引 (age 升序排序, phone 倒序排序 )

sql 复制代码
create index idx_age_phone_ad on tb_user(age asc ,phone desc);


H. 然后再次执行如下 SQL

sql 复制代码
 explain select id,age,phone from tb_user order by age asc ,phone desc ;


升序 /降序联合索引结构图示:

由上述的测试,我们得出order by优化原则:
A. 根据排序字段建立合适的索引,多字段排序时,也遵循最左前缀法则。
B. 尽量使用覆盖索引。
C. 多字段排序 , 一个升序一个降序,此时需要注意联合索引在创建时的规( ASC/DESC )。
D. 如果不可避免的出现 filesort ,大数据量排序时,可以适当增大排序缓冲区大小 sort_buffer_size(默认 256k) 。

二、group by****优化

分组操作,我们主要来看看索引对于分组操作的影响。
首先我们先将 tb_user 表的索引全部删除掉 。

sql 复制代码
drop index pro_age_sta on tb_user;
drop index index_pro on tb_user;
drop index  index_email on tb_user;
drop index idx_age_phone on tb_user;
drop index idx_age_phone_ad on tb_user;


接下来,在没有索引的情况下,执行如下 SQL ,查询执行计划:

sql 复制代码
explain select profession , count(*) from tb_user group by profession ;


然后,我们在针对于 profession , age , status 创建一个联合索引。

sql 复制代码
create index idx_user_pro_age_sta on tb_user(profession , age , status);


紧接着,再执行前面相同的SQL查看执行计划。

sql 复制代码
explain select profession , count(*) from tb_user group by profession ;

再执行如下的分组查询 SQL ,查看执行计划:

sql 复制代码
-- 单独根据age分组
explain select age,count(*) from tb_user group by age;
sql 复制代码
-- 根据profession 与 age 分组
explain select age,count(*) from tb_user group by profession,age;


我们发现,如果仅仅根据 age 分组,就会出现 Using temporary ;而如果是 根据 profession,age两个字段同时分组,则不会出现 Using temporary 。原因是因为对于分组操作,在联合索引中,也是符合最左前缀法则的。

所以,在分组操作中,我们需要通过以下两点进行优化,以提升性能:
A. 在分组操作时,可以通过索引来提高效率。
B. 分组操作时,索引的使用也是满足最左前缀法则的。

好了,以上就是本期的全部内容了,我们下次见。

分享一张壁纸:

相关推荐
sunxunyong3 小时前
CGroup配置
linux·运维·服务器
小吴编程之路3 小时前
MySQL 索引核心特性深度解析:从底层原理到实操应用
数据库·mysql
hy____1233 小时前
Linux_网络编程套接字
linux·运维·网络
~莫子3 小时前
MySQL集群技术
数据库·mysql
凤山老林3 小时前
SpringBoot 使用 H2 文本数据库构建轻量级应用
java·数据库·spring boot·后端
若风的雨3 小时前
【deepseek】 Linux 调度延时分析
linux
就不掉头发3 小时前
Linux与数据库进阶
数据库
与衫3 小时前
Gudu SQL Omni 技术深度解析
数据库·sql
咖啡の猫4 小时前
Redis桌面客户端
数据库·redis·缓存
oradh4 小时前
Oracle 11g数据库软件和数据库静默安装
数据库·oracle