假如你是MySQL作者，你会如何实现order by?

大家好，我是IT周瑜，最近在研究MySQL源码，同时自己也在尝试手写一个MySQL，发现挺有趣的，因此这篇文章来跟大家一起扮演MySQL作者，一起来分析一下order by该如何实现。

大家如果对手写MySQL感兴趣，可以关注我的公众号：IT周瑜

大家先看以下SQL：

sql 复制代码

select * from t1 order by name;

以上SQL对应的需求很简单：对t1表中的全部数据按照name字段进行升序排序。

请大家思考5秒钟：如果你是MySQL作者，你会如何实现以上需求？

思路一

首先，我想到的最简单的思路是：

思路很简单，但是我在想一个问题：如果表的数据特别多呢？如果没有足够的内存来存储所有数据呢？

也就是说，如果数据比较多，思路一就行不不通了，于是，我想到了思路二。

思路一的问题在于不能处理数据量比较大的情况，那么，我们能不能减少内存List中的数据呢，答案是可以的。

思路一的内存List中是存了一条记录的全部字段，那能不能只存部分字段呢，比如只存排序字段和主键，于是我得到思路二：

此思路的：

思路二相比较思路一：能支持更多数据的排序，但整个过程多了回表步骤。

思路二的缺点2，依然是内存不够的情况，俗话说："内存不够，磁盘来凑"，我的思路是：

思路三是这样的：

这样，不管表里面有多少条记录，都会先加到内存List中，内存List如果满了就持久化到临时文件，最后对所有的临时文件进行归并排序，这种思路理论上是可以处理无限多条数据的。

不过要注意，文件的归并排序，不能把文件的内容都读到内存中进行排序，这样就违背了内存不够的前提。

文件的归并排序步骤是这样的：

在这个过程中每次都只占用了两条记录的内存空间。

对于思路三：

以上三种思路，要么基于内存排序，要么基于文件排序，都需要排序，那有没有不需要进行排序的呢？

那就是索引了，因为索引的本质就是对数据按指定的索引字段进行排序，所以如果排序字段有索引，那么直接取索引上现成的、已经排好序的记录直接返回给客户端就好了。

MySQL说："成年人不做选择，我都要"。

MySQL会自动进行选择：

上面提到的内存List，在MySQL中叫做sort_buffer，默认大小为256KB，可以通过sort_buffer_size参数进行配置。

好啦，以上就是order by的实现思路，大家还有其他的实现思路吗？

大家如果对手写MySQL感兴趣，可以关注我的公众号：IT周瑜