order by除了加索引,我们还可以怎么优化?

大家好,我是小趴菜,在平常业务中,排序是一个十分常见的需求,但是有些时候,因为一些操作导致我们排序的效率特别的低下,这时候我们通常会给排序的字段添加索引来解决,除了给排序字段添加索引,我们是否还有其它的优化手段呢?

order by原理

既然要优化,那么我们就必须要明白order by的底层原理是怎么样的

js 复制代码
select * from t_user where id > 10 order by age;
  • 1:MySql会根据where条件查询出所有符合条件的记录
  • 2:将查询的结果集放入sort_buffer中(排序内存)
  • 3:对中间结果集按照ORDER BY字段排序
  • 4:回表生成完整的结果集(如果需要)

以上就是我们在执行上述SQL要执行的步骤,也是ORDER BY的实现原理,那么我们要优化的地方有以下几点

优化点一:中间结果集

MySql首先会按照where条件查询出所有符合条件的记录,然后将结果集放入sort_buffer中,但是这里要注意的是,sort_buffer是有大小限制的,如果你的中间结果集大于这个sort_buffer的大小,那么这个中间集就不会放入内存中进行排序,而是放在硬盘中了。

我们都知道在内存中排序比在硬盘中排序效率是高出特别多的,我们可以使用 *show variables like '%sort_buffer_size%';*来查看sort_buffer的大小

所以当你的内存足够大的时候,我们可以适当调大sort_buffer的大小,让数据尽可能的在内存中排序,而不是进入到硬盘中

优化点二: 回表生成完整结果集

我们看最后一步,如果需要ORDER BY需要回表生成结果集,什么是回表呢?就是拿到这条记录的主键ID,到主键索引中找到整条记录。

比如说,我们一张表有一百多个字段,这时候我们需要把这一百多个字段都查询出来的,那么这时候,中间结果集可能不会有所有的字段,而是排序字段+主键,举个例子,如下,假设我们t_user表有一百多个字段

js 复制代码
select * from t_user where id > 10 order by age;

这时候首先会按照where条件查询出中间结果集,但是这时候的中间结果集可能不会有所有的字段,而是只有age+id二个字段,等排序结束以后,再拿主键回表查询整条记录,所以就造成了回表。

当要查询的字段小于这个阈值的时候,中间结果集就把所有字段都查出来,后续也就不需要回表了。但是当大于这个阈值的时候,就需要回表了

但是不能无脑的把这个值调大,来避免回表,还记得优化点一吗?? 如果你中间结果集太大,就不会在内存中进行排序,而是在硬盘中排序了。

总结

除了以上几点,我们最好是能使用到覆盖索引,这样就不用生成中间结果集中,可以直接输出结果了。

相关推荐
星星在线1 小时前
MusicFree:一个「All in One」的个人音乐服务器,让听歌回归简单
前端·后端
IT_陈寒2 小时前
Redis的SETNX并发问题让我加了三天班
前端·人工智能·后端
demo007x2 小时前
Docling 文档转换以及技术架构分析
前端·后端·程序员
NE_STOP4 小时前
Vide Coding--AI编程工具的选择
java
袋鱼不重4 小时前
我的神奇同事,AI 用多了居然写了个 Open In Codex
前端·后端·ai编程
用户8356290780514 小时前
使用 Python 操作 Word 内容控件
后端·python
像我这样帅的人丶你还4 小时前
啥? 前端也要会干Java?🛵🛵🛵
后端
Hommy884 小时前
【剪映小助手】添加贴纸接口(Add Sticker)
后端·github·剪映小助手·视频剪辑自动化·剪映api
码云数智-园园4 小时前
C++20 Modules 模块详解
java·开发语言·spring
程序员黑豆4 小时前
JDK 下载安装与配置详细教程
java·前端·ai编程