order by除了加索引,我们还可以怎么优化?

大家好,我是小趴菜,在平常业务中,排序是一个十分常见的需求,但是有些时候,因为一些操作导致我们排序的效率特别的低下,这时候我们通常会给排序的字段添加索引来解决,除了给排序字段添加索引,我们是否还有其它的优化手段呢?

order by原理

既然要优化,那么我们就必须要明白order by的底层原理是怎么样的

js 复制代码
select * from t_user where id > 10 order by age;
  • 1:MySql会根据where条件查询出所有符合条件的记录
  • 2:将查询的结果集放入sort_buffer中(排序内存)
  • 3:对中间结果集按照ORDER BY字段排序
  • 4:回表生成完整的结果集(如果需要)

以上就是我们在执行上述SQL要执行的步骤,也是ORDER BY的实现原理,那么我们要优化的地方有以下几点

优化点一:中间结果集

MySql首先会按照where条件查询出所有符合条件的记录,然后将结果集放入sort_buffer中,但是这里要注意的是,sort_buffer是有大小限制的,如果你的中间结果集大于这个sort_buffer的大小,那么这个中间集就不会放入内存中进行排序,而是放在硬盘中了。

我们都知道在内存中排序比在硬盘中排序效率是高出特别多的,我们可以使用 *show variables like '%sort_buffer_size%';*来查看sort_buffer的大小

所以当你的内存足够大的时候,我们可以适当调大sort_buffer的大小,让数据尽可能的在内存中排序,而不是进入到硬盘中

优化点二: 回表生成完整结果集

我们看最后一步,如果需要ORDER BY需要回表生成结果集,什么是回表呢?就是拿到这条记录的主键ID,到主键索引中找到整条记录。

比如说,我们一张表有一百多个字段,这时候我们需要把这一百多个字段都查询出来的,那么这时候,中间结果集可能不会有所有的字段,而是排序字段+主键,举个例子,如下,假设我们t_user表有一百多个字段

js 复制代码
select * from t_user where id > 10 order by age;

这时候首先会按照where条件查询出中间结果集,但是这时候的中间结果集可能不会有所有的字段,而是只有age+id二个字段,等排序结束以后,再拿主键回表查询整条记录,所以就造成了回表。

当要查询的字段小于这个阈值的时候,中间结果集就把所有字段都查出来,后续也就不需要回表了。但是当大于这个阈值的时候,就需要回表了

但是不能无脑的把这个值调大,来避免回表,还记得优化点一吗?? 如果你中间结果集太大,就不会在内存中进行排序,而是在硬盘中排序了。

总结

除了以上几点,我们最好是能使用到覆盖索引,这样就不用生成中间结果集中,可以直接输出结果了。

相关推荐
Lee川1 小时前
面试通关:JWT 认证与双 Token 机制深度解析
后端·面试
dfdfadffa3 小时前
如何用模块化方案组织一个可扩展的前端组件库项目
jvm·数据库·python
2301_812539673 小时前
SQL中如何高效实现分组数据的批量更新_利用窗口函数与JOIN
jvm·数据库·python
2501_901200533 小时前
如何实现SQL存储过程存储过程参数标准化_统一命名规范
jvm·数据库·python
运气好好的4 小时前
Golang怎么用embed嵌入SQL文件_Golang如何将SQL迁移文件嵌入Go程序统一管理【技巧】
jvm·数据库·python
想学习java初学者4 小时前
SpringBoot整合Vertx-Mqtt多租户(优化版)
java·spring boot·后端
AC赳赳老秦4 小时前
政企内网落地:OpenClaw 离线环境深度适配方案,无外网场景下本地化模型对接与全功能使用
java·大数据·运维·python·自动化·deepseek·openclaw
weixin_449173654 小时前
在 Java 中,‌线程安全的 List‌ 主要有以下几种实现方式,它们的效率取决于具体的使用场景(尤其是读写比例):
java·线程安全的list
念何架构之路4 小时前
MySql常见ORM
数据库·mysql
砚底藏山河4 小时前
股票数据API接口:如何获取股票历历史分时KDJ数据
java·python·maven