JavaSE 排序

[1 概念](#1 概念)
- [1.1 排序](#1.1 排序)
- [1.2 稳定性](#1.2 稳定性)
[2 常见基于比较排序算法总览](#2 常见基于比较排序算法总览)
[3 插入排序](#3 插入排序)
- [3.1 直接插入排序](#3.1 直接插入排序)
- - [3.1.1 思想](#3.1.1 思想)
  - [3.1.2 实现](#3.1.2 实现)
  - [3.1.3 性能分析](#3.1.3 性能分析)
- [3.2 折半插入排序](#3.2 折半插入排序)
- - [3.2.1 思想](#3.2.1 思想)
  - [3.2.2 实现](#3.2.2 实现)
  - [3.2.3 性能分析](#3.2.3 性能分析)
- [3.3 希尔排序](#3.3 希尔排序)
- - [3.3.1 思想](#3.3.1 思想)
  - [3.3.2 实现](#3.3.2 实现)
  - [3.3.3 性能分析](#3.3.3 性能分析)
[4 选择排序](#4 选择排序)
- [4.1 选择排序](#4.1 选择排序)
- - [4.1.1 思想](#4.1.1 思想)
  - [4.1.2 实现](#4.1.2 实现)
  - [4.1.3 性能分析](#4.1.3 性能分析)
  - [4.1.4 双向选择排序](#4.1.4 双向选择排序)
- [4.2 堆排序](#4.2 堆排序)
- - [4.2.1 思想](#4.2.1 思想)
  - [4.2.2 实现](#4.2.2 实现)
  - [4.2.3 性能分析](#4.2.3 性能分析)
[5 交换排序](#5 交换排序)
- [5.1 冒泡排序](#5.1 冒泡排序)
- - [5.1.1 思想](#5.1.1 思想)
  - [5.1.2 实现](#5.1.2 实现)
  - [5.1.3 性能分析](#5.1.3 性能分析)
- [5.2 快速排序](#5.2 快速排序)
- - [5.2.1 思想](#5.2.1 思想)
  - [5.2.2 实现](#5.2.2 实现)
  - [5.2.3 性能分析](#5.2.3 性能分析)
[6 归并排序](#6 归并排序)
- 6.1归并排序
- - [6.1.1 思想](#6.1.1 思想)
  - [6.1.2 实现](#6.1.2 实现)
  - [6.1.3 性能分析](#6.1.3 性能分析)
[7 海量数据的排序问题](#7 海量数据的排序问题)
[8 总结](#8 总结)
[9 其他非基于比较的排序（了解）](#9 其他非基于比较的排序（了解）)

1 概念

1.1 排序

排序，就是使一串记录，按照其中的某个或某些关键字的大小，递增或递减的排列起来的操作。

平时的上下文中，如果提到排序，通常指的是排升序（非降序）。

通常意义上的排序，都是指的原地排序(in place sort)。

1.2 稳定性

两个相等的数据，如果经过排序后，排序算法能保证其相对位置不发生变化，则我们称该算法是具备稳定性的排序算法。

如果当前这个排序，在排序过程中没有发生跳跃式的交换，那么我们认为这个排序是稳定的排序。所以堆排序不是一个稳定的排序。

一个排序如果是稳定的排序，那么它也可以被实现为一个不稳定的排序；
但是如果一个排序本身就是不稳定的排序，那么就不可能实现为一个稳定的排序。

如下图所示就是一个稳定的排序：

2 常见基于比较排序算法总览

内部排序： 所有的数据都是在内存上的（程序的内存），也就是说这些所要排序的数据要在内存上可以存储。
外部排序： 数据都在磁盘上E F D等。

如下图所示就是常见的排序算法：

3 插入排序

3.1 直接插入排序

3.1.1 思想

直接插入排序是一种最简单的排序方法，它的基本思想就是：把一个数据插入到一个有序的序列中去，从而得到一个新的有序序列。

其基本步骤可以概括为两步：

取出一个元素，留出空位；

符合条件的元素右移，把取出的元素插入。

那么这样的话，我们就需要一个辅助的变量来临时缓存这个被取出的变量，一般我们把这个辅助变量称之为"哨兵"。

那么给定一组无序的数据, 实现直接插入排序的具体过程是什么样的呢?是否是一个稳定的排序呢？下面我们给定一组数据为{22， 11， 33， 10， 22}，对其进行直接插入排序具体过程如下所示：

第一趟插入排序：
因为是取出一个元素和前一个元素对比，根据大小关系决定插入到第一个元素的左边或者右边，所以第一趟排序应该从取出第二个元素开始，即i初始值为2。
假设给定一个序列{22， 11， 33， 10， 22}，首先取出第二个元素11，用11和22比较，22大于11则22右移一位，然后把11插入到22的位置，即0号下标处。在第一趟排序中，进行了一次比较，一次元素移动。通过第一趟排序形成了一个包含两元素的有序子序列。
第二趟插入排序：
取出第三个元素，第三个元素array $2$ 与第二个元素array $1$ 对比，若：
（1）array $2$ >array $1$ ，那么就把array $2$ 插入到原处，即不进行任何操作，结束本趟插入排序；
（2）如果array $2$ <array $1$ ，那么array $1$ 右移一位，array $2$ 继续和array $0$ 比较；如果array $2$ >array $0$ ，那么array $2$ 插入到1号位置，结束本趟插入排序；
（3）如果array $2$ <array $0$ ，那么array $0$ 右移一位，array $2$ 插入到0号位置。

第二趟排序进行了一次比较，0次元素移动（这是最好的情况，即本来子序列就已经从小到大了）。经过第二趟排序，有序子序列加一，这也是插入法之所以称为插入的原因：把一个记录插入到一个有序的序列中。
第三趟插入排序：
取出第四个元素，执行比较-移动-插入三部曲操作。

第三趟排序，进行了三次比较，三次移动，这是最坏的情况，即每次比较都要移动。经过第三趟排序，有序序列再次加1，无序序列减一。
第n-1趟插入排序：
第n-1趟插入排序，将进行最少1次比较，0次移动；最多n-1次比较，n-1次移动。

且通过示意图可以看到，红色22本来就在黑色22前面，经过插入排序后，红色22依然在黑色22前面，所以插入排序是稳定排序。

注：此小节内容摘自博客https://blog.csdn.net/qq_43471489/article/details/125583368，具体可点击链接进入该博客学习。

3.1.2 实现

直接插入排序实现代码如下所示：

java 复制代码

import java.util.Arrays;
public class TestSort {
    /*
    * 时间复杂度:
    *     最坏情况下：当数据是无序的情况下是 O(n^2)
    *     最好情况下：当数据有序的时候可以达到 O(n)
    *     所以：结论：越有序越快。
    * 
    *     题目：
    *       1.当前有一组待排序序列，但是这组待排序序列大部分是有序的，请问下面哪个排序更适合？
    *         答案：直接插入排序。
    *       2. 另外：直接插入排序一般也会用在一些排序的优化上。
    *         答案：快速排序
    * 
    * 空间复杂度：
    * 稳定性：稳定的排序
    * */
    public static void insertSort(int[] array){
        for (int i = 1; i < array.length; i++) {
            int tmp = array[i];
            int j = i-1;
            for (; j >= 0; j--) {
                //如果这里是一个大于等于号，此时这个排序就不稳定了
               if(array[j] > tmp){
                   array[j+1] = array[j];
               }else {
                   break;
               }
        }
            array[j+1] = tmp;
    }}
    public static void main(String[] args) {
        int[] array = {10,3,2,7,19,78,65,127};
        System.out.println(Arrays.toString(array));
        insertSort(array);
        System.out.println(Arrays.toString(array));
    }
}

3.1.3 性能分析

时间复杂度			空间复杂度
最好	平均	最坏
O(n)	O(n^2)	O(n^2)	O(1)
数据有序		数据逆序

稳定性： 稳定。
特点： 插入排序，初始数据越接近有序，时间效率越高。

3.2 折半插入排序

3.2.1 思想

折半插入排序是将折半查找方法与直接插入排序方法相结合，借助二分查找的思想，先查找插入位置，再移动数据，最后插入到正确的位置。

那么给定一组无序的数据, 实现折半插入排序的具体过程是什么样的呢?下面我们给定一组数据为{6， 1， 3， 5， 4，2}，对其进行折半插入排序具体过程如下所示：

第一趟排序：
折半插入排序首先把第一个元素直接放到排好序的数组中，第二个元素可以使用直接插入排序法进行排序，从第三个元素开始进行插入排序。
第二趟排序：
l =0表示左，h=1表示右，m=(l+h)/2=1表示中间，其位置如下表所示，元素arr $2$ =3是待插入元素，首先将其缓存到t。

此时arr $m$ < t，因此修改l为m+1=1，之后重新计算m=(l+h)/2=1。

再次比较出现arr $m$ > t，因此修改h为m-1=0,出现了h<l的情形，因此结束本趟的排序，记录h的位置（h=0），然后把h+1位置的元素向后移动一位，将t的值插入到arr $h+1$ 。
第三趟排序：
将元素arr $3$ 缓存给t，然后重复第二趟排序的方法即可。
第四趟排序和第五趟排序，同上述方法一样，经过五趟排序之后，就完成了对该数组的折半插入排序。

我们都知道直接插入排序是一个边比较边移动的过程，而折半插入排序是先确定插入的位置，再来进行移动。插入排序的效率是由比较的次数和移动的次数共同决定的，而折半插入排序就是通过降低比较的次数来提高排序的效率。

在有序区间选择数据应该插入的位置时，因为区间的有序性，可以利用折半查找的思想。
注：此小节内容摘自博客https://blog.csdn.net/sunnyoldman001/article/details/127032485，具体可点击链接进入该博客学习。

3.2.2 实现

折半插入排序实现代码如下所示：

java 复制代码

public static void bsInsertSort(int[] array) {
    for (int i = 1; i < array.length; i++) {
        int v = array[i];
        int left = 0;
        int right = i;
        // [left, right)
        // 需要考虑稳定性
        while (left < right) {
            int m = (left + right) / 2;
            if (v >= array[m]) {
                left = m + 1;
           } else {
                right = m;
           }
       }
        // 搬移
        for (int j = i; j > left; j--) {
            array[j] = array[j - 1];
       }
       array[left] = v;
   }
}

3.2.3 性能分析

时间复杂度			空间复杂度
最好	平均	最坏
O(n)	O(n^2)	O(n^2)	O(1)
数据有序		数据逆序

稳定性： 稳定。
特点： 通过减少元素比较次数使得排序效率得到提高。

3.3 希尔排序

3.3.1 思想

希尔排序法又称缩小增量法。

希尔排序法的基本思想是：先选定一个整数gap，把待排序序列中所有数据分成gap个组，所有距离为(数据总数/gap)的数据分在同一组内，并对每一组内的数据分别进行直接插入排序。然后，取、重复上述分组和排序的工作。当到达gap=1时，所有记录在统一组内排好序。

那么给定一组无序的数据, 实现希尔排序的具体过程是什么样的呢?如下图所示给定了15个数据，进行希尔排序的具体过程为：

我们先选定一个整数gap=5，也就是将这组数据分成了5组；
所有距离为15/5 = 3的数据分在同一组内（也就是同种颜色线条所指的三个数字为一组，即12，8，7就是第一组；5，27，4为第二组等）。
对每一组内的数据分别进行直接插入排序得到一个结果。
对于这个结果我们再选定一个整数gap=3，也就是将这组数据分成了3组，所有距离为5的数据分在同一组内，对每一组内的数据分别进行直接插入排序再得到一个结果。
对于第四步中得到的这个结果再选定一个整数gap=1，也就是将这组数据分成了1组，对这一组数据进行直接插入排序得到最终排序结果。

注意： 这里的gap为增量数组，也就是随机设定的这几个数字都必须降序且为素数，且最后一个值一定为1即可。

下图为一个希尔排序的示例：

3.3.2 实现

希尔排序实现代码如下所示：

java 复制代码

import java.util.Arrays;
public class TestSort {
    //这个函数其实就是一个每组的直接插入排序了
    public static void shell(int[] array,int gap){
        for (int i = gap; i < array.length; i++) {
            int tmp = array[i];
            int j = i-gap;
            for (; j >= 0; j=j-gap) {
                //如果这里是一个大于等于号，此时这个排序就不稳定了
                if(array[j] > tmp){
                    array[j+gap] = array[j];
                }else {
                    break;
                }
            }
            array[j+gap] = tmp;
        }
    }
    public static void shellSort(int[] array){
        int[] drr = {5,3,1};//增量数组：这几个数字都必须为素数，且最后一个值一定为1即可

        for (int i = 0; i < drr.length; i++) {
            shell(array,drr[i]);
        }
    }
    public static void main(String[] args) {
        int[] array = {10,3,2,7,19,78,65,127};
        System.out.println(Arrays.toString(array));
        shellSort(array);
        System.out.println(Arrays.toString(array));
    }
}

3.3.3 性能分析

由于gap取值不唯一，希尔排序的时间复杂度不好计算，因此在希尔排序的时间复杂度不固定，所以下表中的最好和平均时间复杂度均为估算。

时间复杂度			空间复杂度
最好	平均	最坏
O(n^1.3)	O(n^1.5)	O(n^2)	O(1)
数据有序		比较难构造

稳定性： 不稳定。
特点：

希尔排序是对直接插入排序的优化。
当gap > 1时都是预排序，目的是让数组更接近于有序。当gap == 1时，数组已经接近有序的了，这样排序速度就会很快。这样整体而言，可以达到优化的效果。

4 选择排序

4.1 选择排序

4.1.1 思想

每一次从无序区间选出最大（或最小）的一个元素，存放在无序区间的最后（或最前），直到全部待排序的数据元素排完。即：

在待排序的一组数据中，选出最小（最大）的一个数与第一个位置的数交换。
例：如下图所示序列【12，5，9，16，6】，此时i是12，j是5，j比i小，j、i所指的数字互换，得到 $5,12,9,16,6$ ；
然后j+1遇到j比i小的情况时，j、i所指的数字就互换，直到j指向最后一个数字结束第一轮选择排序，这里得到的结果还是 $5,12,9,16,6$ 。
然后在剩下的数中，再找最小（最大）的数与第二个位置的数交换位置。
例：此时序列变为 $5,12,9,16,6$ ，则此时i是12，j是9，j比i小，j、i所指的数字互换，得到 $5,9,12,16,6$ ；
然后j+1遇到j比i小的情况时，j、i所指的数字就互换，直到j指向最后一个数字结束第一轮选择排序，这里得到的结果是 $5,6,1216,9$ 。
依次类推直到第 n-1 个元素与第 n 个元素交换位置，选择排序结束。

4.1.2 实现

选择排序实现代码如下所示：

java 复制代码

import java.util.Arrays;
public class TestSort {
 /*
    * 选择排序:
    * 时间复杂度：O(n^2)
    * 空间复杂度：O(1)
    * 稳定性：不稳定
    * */
    public static void selectSort(int[] array){
        for (int i = 0; i < array.length-1; i++) {
            for (int j = i+1; j <array.length; j++) {
                if(array[j] < array[i]){
                    int tmp = array[j];
                    array[j] = array[i];
                    array[i] = tmp;
                }
            }
        }

    }
    public static void main(String[] args) {
        int[] array = {10,3,2,7,19,78,65,127};
        System.out.println(Arrays.toString(array));
        selectSort(array);
        System.out.println(Arrays.toString(array));
    }
}

4.1.3 性能分析

时间复杂度	空间复杂度
O(n^2)	O(1)

稳定性： 不稳定。

int\[\] a = { 9, 2, 5a, 7, 4, 3, 6, 5b };

// 交换中该情况无法识别，保证 5a 还在 5b 前边

4.1.4 双向选择排序

思想： 每一次从无序区间选出最小 + 最大的元素，存放在无序区间的最前和最后，直到全部待排序的数据元素排完。

双向选择排序实现代码如下所示：

java 复制代码

public static void selectSortOP(int[] array) {
    int low = 0;
    int high = array.length - 1;
    // [low, high] 表示整个无序区间
    // 无序区间内只有一个数也可以停止排序了
    while (low <= high) {
        int min = low;
        int max = low;
        for (int i = low + 1; i <= max; i++) {
            if (array[i] < array[min]) {
                min = i;
           }
            if (array[i] > array[max]) {
                max = i;
           }
       }
        
        swap(array, min, low);
        // 见下面例子讲解
        if (max == low) {
            max = min;
       }
        swap(array, max, high);
   }
}
private void swap(int[] array, int i, int j) {
    int t = array[i];
    array[i] = array[j];
    array[j] = t;
}

理解：

array = { 9, 5, 2, 7, 3, 6, 8 }; // 交换之前
// low = 0; high = 6
// max = 0; min = 2

array = { 2, 5, 9, 7, 3, 6, 8 }; // 将最小的交换到无序区间的最开始后
// max = 0，但实际上最大的数已经不在 0 位置，而是被交换到 min 即 2 位置了
// 所以需要让 max = min 即 max = 2

array = { 2, 5, 8, 7, 3, 6, 9 }; // 将最大的交换到无序区间的最结尾后

4.2 堆排序

4.2.1 思想

基本原理也是选择排序，只是不在使用遍历的方式查找无序区间的最大的数，而是通过堆来选择无序区间的最大的数。
注意： 排升序要建大堆；排降序要建小堆。

具体思想可借助下图和链接https://blog.csdn.net/weixin_51312723/article/details/134121250进行理解：

4.2.2 实现

堆排序实现代码在链接https://blog.csdn.net/weixin_51312723/article/details/134121250中的3.7.2节详见。

4.2.3 性能分析

时间复杂度	空间复杂度
O(nlog2(n))	O(1)

稳定性： 不稳定。

5 交换排序

5.1 冒泡排序

5.1.1 思想

在无序区间，通过相邻数的比较，将最大的数冒泡到无序区间的最后，持续这个过程，直到数组整体有序。

从第一个下标开始，也就是0，比较第一个和第二个元素，如果第一个元素比第二个元素大，那就交换两者。
然后比较第二个元素和第三个元素，如果两者也不是升序，那交换两者，一直比较和交换，直到最后。
之后就是不断迭代上述步骤直到数组整体有序即可。

5.1.2 实现

java 复制代码

public static void bubbleSort(int[] array) { 
    for (int i = 0; i < array.length - 1; i++) { 
    boolean isSorted = true; 
    for (int j = 0; j < array.length - i - 1; j++) { 
        // 相等不交换，保证稳定性
        if (array[j] > array[j + 1]) { 
        swap(array, j, j + 1); 
        isSorted = false; 
        } 
        } 
    if (isSorted) { 
        break; 
        } 
        }}

5.1.3 性能分析

时间复杂度			空间复杂度
最好	平均	最坏
O(n)	O(n^2)	O(n^2)	O(1)
数据有序		数据逆序

稳定性： 稳定。

5.2 快速排序

5.2.1 思想

快速排序思想总览：

从待排序区间选择一个数，作为基准值(pivot)；
Partition: 遍历整个待排序区间，将比基准值小的（可以包含相等的）放到基准值的左边，将比基准值大的（可以包含相等的）放到基准值的右边；
采用分治思想，对左右两个小区间按照同样的方式处理，直到小区间的长度 = 1 ，代表已经有序，或者小区间的长度 = 0，代表没有数据。

选择基准的方法：

选择边上（左或者右）：例如最简单的选择基准值的方式，选择 array $left$ 作为基准值。
随机选取基准法：就是随机找到后边的一个下标，然后和low下标的数据进行交换，最后以low下标交换后的值作为基准。
几数取中（例如三数取中）法：array $left$ , array $mid$ , array $right$ 大小是中间的为基准值。

具体通过选择边上（左或者右）法找基准的过程借助下图进行理解：

5.2.2 实现

快速排序实现代码如下所示：

java 复制代码

import java.util.Arrays;
public class TestSort {
    /*
    * 快速排序:
    * 时间复杂度：最好：O(n*log2^(n)) 最坏（有序的情况）：O(n^2)
    * 所以在有序的情况下我们就要优化这个快速排序！---优化方法是：使用三数取中找基准法进行优化
    * 空间复杂度：O(log2^(n))
    * 稳定性：不稳定
    * 
    * 分治思想：什么时候效率最高？
    * 答：每次把待排序序列均匀的划分。
    * 
    * 调JVM的栈参数
    * 
    * 快速排序的递归和非递归 及递归的优化方式
    * */

    //找基准-选择边上（左或者右）法
    //最简单的选择基准值的方式，选择 array[left] 作为基准值
    public static int pivot(int[] array,int start,int end){
        int tmp = array[start];
        while(start < end){
            while(start < end && array[end] >= tmp){
                end--;
            }
                array[start] = array[end];

            //把数据赋值给start
            while(start < end && array[start] <= tmp){
                start++;
            }
            //把start下标的值给end
                array[end] = array[start];
        }
        array[start] = tmp;
        return start;
    }

    //三数取中找基准法
    public static void swap(int[] array,int k,int i){
        int tmp = array[k];
        array[k] = array[i];
        array[i] = tmp;
    }
    public static void medianOfThree(int[] array,int low,int high){
         int mid = (low+high)/2;
         
         //array[mid] <= array[low] <= array[high]
         if(array[low] < array[mid]){
             swap(array,low,mid);
         } //array[mid] <= array[low]

         if(array[low] > array[high]){
             swap(array,low,high);
         } // array[low] <= array[high]

         if(array[mid] > array[high]){
             swap(array,mid,high);
         } // array[mid] <= array[high]
    }
    public static void insertSortBount(int[] array,int low,int high){
        for (int i = low+1; i <= high; i++) {
            int tmp = array[i];
            int j = i-1;
            for (; j >= low; j--) {
                //如果这里是一个大于等于号，此时这个排序就不稳定了
               if(array[j] > tmp){
                   array[j+1] = array[j];
               }else {
                   break;
               }
        }
            array[j+1] = tmp;
    }
    }
    
    public static void quick(int[] array,int low,int high){
        if(low >= high) return;
        //if(high - low +1 <= 50){
            //使用插入排序
            //insertSortBount(array,low,high);
            //return;//记者这里一定要return，这里说明这个区间范围有序了，直接结束
       // }
        //if(low < high){
            medianOfThree(array,low,high);//优化方法代码
            
            //这个之前进行一个优化
            int piv = pivot(array,low,high);
            quick(array,low,piv-1);
            quick(array,piv+1,high);
        }
    }
   
   //递归
    public static void quickSort(int[] array){
        long startTime = System.currentTimeMillis();//这里时间的单位是毫秒ms
        
        quick(array,0,array.length-1);
        
        long endTime = System.currentTimeMillis();
        System.out.println(endTime- startTime);
    }
    
   //非递归
    /*
    * 和递归是一样的
    * 时间复杂度：最好：O(n*log2^(n))
    * 空间复杂度：O(n)   最好空间复杂度：log2^(n)
    * */
    public static void quickSort1(int[] array){
        Stack<Integer> stack = new Stack<>();
        int low = 0;
        int high = array.length-1;
        int piv = pivot(array,low,high);
        if(piv > low+1){
            stack.push(low);
            stack.push(piv-1);
        }
        if(piv < high-1){
            stack.push(piv+1);
            stack.push(high);
        }
        while (!stack.empty()) {
            high = stack.pop();
            low = stack.pop();
            piv = pivot(array,low,high);
            if(piv > low+1){
                stack.push(low);
                stack.push(piv-1);
            }
            if(piv < high-1){
                stack.push(piv+1);
                stack.push(high);
            }
        }
        }
    //测试一下优化后的快速排100000个数据所需的时间
    public static void main(String[] args) {
        int[] array = new int[1_0000];
        Random random = new Random();
        for(int i = 0; i < array.length; i++){
           //array[i] = i;
           array[i] = random.nextInt(1_0000);
        }
        long startTime = System.currentTimeMillis();
        quickSort(array);
        long endTime = System.currentTimeMillis();
        System.out.println(endTime-startTime);
        System.out.println(Arrays.toString(array));
    }
    public static void main1(String[] args) {
        int[] array = {10,3,2,7,19,78,65,127};
        System.out.println(Arrays.toString(array));
        quickSort(array);
        System.out.println(Arrays.toString(array));
    }
}

5.2.3 性能分析

时间复杂度		空间复杂度
最好	最坏
O(n*log2^(n))	O(n^2)	O(log2^(n))
	数据有序

求递归的时间复杂度： 递归次数每一次遍历次数。
这里的递归次数：log2 ^ n,也就是二叉树的高度；且每一次都要遍历n次；所以此时时间复杂度为 O(n log2^(n))。
稳定性： 不稳定。
总结：

选择基准值很重要，通常使用几数取中法。
pivot 过程（使得小的数在左，大的数在右）把和基准值相等的数也选择出来。
分治处理左右两个小区间，待小区间小于一个阈值时（例如 48），使用直接插入排序对快速排序进行优化。插入排序越有序越快

6 归并排序

6.1归并排序

6.1.1 思想

归并排序（MERGE-SORT）是建立在归并操作上的一种有效的排序算法,该算法是采用分治法（Divide andConquer）的一个非常典型的应用。将已有序的子序列合并，得到完全有序的序列；即先使每个子序列有序，再使子序列段间有序。若将两个有序表合并成一个有序表，称为二路归并。具体过程如下图所示：

6.1.2 实现

归并排序实现代码如下所示：

java 复制代码

import java.util.Arrays;
import java.util.Random;
import java.util.Stack;

public class TestSort {
        /*
        * 归并排序
        * 稳定性：稳定
        * 不管好坏时间复杂度都是：O(n*log2^(n))
        * 空间复杂度：O(n)
        *
        * 堆排 归并 不管好坏时间复杂度都是：O(n*log2^(n))
        * 快排最坏情况下时间复杂度是O(n^2)
        * */

    public static void merge(int[] array,int start,int mid,int end){
        int s1 = start;
        //int e1= mid;
        int s2 = mid+1;
        //int e2 = end;
        int[] tmp = new int[end-start+1];
        int k = 0;//tmp数组的下标

        while(s1 <= mid && s2 <= end){
            if(array[s1] <= array[s2]){
                tmp[k++] = array[s1++];
            }else{
                tmp[k++] = array[s2++];
            }
        }
        //有可能第一个段还有数据 有可能第二个段也有数据
        while(s1 <= mid){
            tmp[k++] = array[s1++];
        }
        while(s2 <= end){
            tmp[k++] = array[s2++];
        }
        for (int i = 0; i < tmp.length ; i++) {
            array[i+start] = tmp[i];
        }
    }
    public static void mergeSortInternal(int[] array,int low,int high){
        if(low >= high) return;
        int mid = (low+high)/2;
        mergeSortInternal(array,low,mid);
        mergeSortInternal(array,mid+1,high);

        //合并的操作
        merge(array,low,mid,high);
    }
    //递归
    public static void mergeSort(int[] array){
        mergeSortInternal(array,0,array.length-1);
    }
    
    //非递归
    public static void merge1(int[] array,int gap){
        int s1 = 0;
        int e1 = s1+gap-1;
        int s2 = e1+1;
        int e2 = s2+gap-1 < array.length ? s2+gap-1:array.length-1;

        int[] tmp = new int[array.length];
        int k = 0;//下标

        //当有两个归并段的时候
        while(s2 < array.length) {
            //当有两个归并段 且 这两个段内都要有数据
            while (s1 <= e1 && s2 <= e2) {
                if (array[s1] <= array[s2]) {
                    tmp[k++] = array[s1++];
                } else {
                    tmp[k++] = array[s2++];
                }
            }
            while (s1 <= e1) {
                tmp[k++] = array[s1++];
            }
            while (s2 <= e2) {
                tmp[k++] = array[s2++];
            }
            s1 = e2 + 1;
            e1 = s1 + gap - 1;
            s2 = e1 + 1;
            e2 = s2 + gap - 1 < array.length ? s2 + gap - 1 : array.length - 1;
        }
        //退出上面循环后，那么把s1段内的数据给拷贝下来，因为 有可能e1已经越界了
        while (s1 <= e1) {
            tmp[k++] = array[s1++];
        }
        for (int i = 0; i < tmp.length; i++) {
            array[i] = tmp[i];
        }
        }
    public static void mergeSort2(int[] array){
        for (int i = 1; i < array.length; i*=2) {
            merge1(array,i);
        }
    }
    
    public static void main(String[] args) {
        int[] array = new int[1_0000];
        Random random = new Random();
        for(int i = 0; i < array.length; i++){
            //array[i] = i;
            array[i] = random.nextInt(1_0000);
        }
        long startTime = System.currentTimeMillis();
        mergeSort(array);
        long endTime = System.currentTimeMillis();
        System.out.println(endTime-startTime);
        System.out.println(Arrays.toString(array));
    }
}

6.1.3 性能分析

时间复杂度	空间复杂度
O(nlog2^(n))	O(n)

稳定性： 稳定。
优化总结： 在排序过程中重复利用两个数组，减少元素的复制过程。

7 海量数据的排序问题

外部排序： 排序过程需要在磁盘等外部存储进行的排序。
前提： 内存只有 1G，需要排序的数据有 100G

因为内存中因为无法把所有数据全部放下，所以需要外部排序，而归并排序是最常用的外部排序。

先把文件切分成 200 份，每个 512 M；
分别对 512 M 排序，因为内存已经可以放的下，所以任意排序方式都可以；
进行 200 路归并，同时对 200 份有序文件做归并过程，最终结果就有序了。

8 总结

排序方法		最好时间复杂度	平均时间复杂度	最坏时间复杂度	空间复杂度	稳定性
交换排序	冒泡排序	O(n)	O(n^2)	O(n^2)	O(1)	稳定
插入排序	直接插入排序	O(n)	O(n^2)	O(n^2)	O(1)	稳定
插入排序	折半插入排序	O(n)	O(n^2)	O(n^2)	O(1)	稳定
选择排序	选择排序	O(n^2)	O(n^2)	O(n^2)	O(1)	不稳定
插入排序	希尔排序	O(n)	O(n^1.3)	O(n^2)	O(1)	不稳定
选择排序	堆排序	O(nlog2(n))	O(nlog2(n))	O(nlog2(n))	O(1)	不稳定
交换排序	快速排序	O(nlog2(n))	O(nlog2(n))	O(n^2)	O(log2^(n)) ~ O(n)	不稳定
归并排序	归并排序	O(nlog2(n))	O(nlog2(n))	O(nlog2(n))	O(n)	稳定

9 其他非基于比较的排序（了解）

计数排序
基数排序
桶排序

目录

1 概念

1.1 排序

1.2 稳定性

2 常见基于比较排序算法总览

3 插入排序

3.1 直接插入排序

3.1.1 思想

3.1.2 实现

3.1.3 性能分析

3.2 折半插入排序

3.2.1 思想

3.2.2 实现

3.2.3 性能分析

3.3 希尔排序

3.3.1 思想

3.3.2 实现

3.3.3 性能分析

4 选择排序

4.1 选择排序

4.1.1 思想

4.1.2 实现

4.1.3 性能分析

4.1.4 双向选择排序

4.2 堆排序

4.2.1 思想

4.2.2 实现

4.2.3 性能分析

5 交换排序

5.1 冒泡排序

5.1.1 思想

5.1.2 实现

5.1.3 性能分析

5.2 快速排序

5.2.1 思想

5.2.2 实现

5.2.3 性能分析

6 归并排序

6.1归并排序

6.1.1 思想

6.1.2 实现

6.1.3 性能分析

7 海量数据的排序问题

8 总结

9 其他非基于比较的排序（了解）