【数据结构】之排序

🏀🏀🏀来都来了，不妨点个关注！
🎧🎧🎧博客主页：欢迎各位大佬!

文章目录

[1 排序](#1 排序)
- [1.1 排序的概念](#1.1 排序的概念)
- [1.2 几种常见的排序算法：](#1.2 几种常见的排序算法：)
[2 常见排序算法的实现](#2 常见排序算法的实现)
- [2.1 插入排序](#2.1 插入排序)
- - 2.1.1直接插入排序：
  - [2.1.2 希尔排序：](#2.1.2 希尔排序：)
- [2.2 选择排序：](#2.2 选择排序：)
- - [2.2.1 选择排序](#2.2.1 选择排序)
  - [2.2.2 堆排序](#2.2.2 堆排序)
- [2.3 交换排序](#2.3 交换排序)
- - [2.3.1 冒泡排序](#2.3.1 冒泡排序)
  - [2.3.2 快速排序](#2.3.2 快速排序)
  - - [2.3.2.1 hoare法](#2.3.2.1 hoare法)
    - [2.3.2.2 挖坑法](#2.3.2.2 挖坑法)
    - [2.3.2.3 快排的优化：](#2.3.2.3 快排的优化：)
  - [2.3.3 快排的非递归实现](#2.3.3 快排的非递归实现)
- [2.4 归并排序](#2.4 归并排序)
- - [2.4.1 基本思想](#2.4.1 基本思想)
  - [2.4.2 递归实现归并排序](#2.4.2 递归实现归并排序)

1 排序

1.1 排序的概念

排序：所谓排序，就是将一串数据，按照其中某个或某些关键字的大小，递增或递减排列起来的操作。
稳定性：将一串数据经过某种排序后，其相同关键字的相对序列仍保持原有的次序。

1.2 几种常见的排序算法：

插入排序：将待排序的值插入到前面已经有序的序列中

选择排序：每次排序选出序列的最大值（或最小值）放到序列的最后面

交换排序：两两比较待排序的序列，并交换不满足序列的那对数

2 常见排序算法的实现

2.1 插入排序

2.1.1直接插入排序：

基本思想：将待排序的值与其前面已排序的值逐个进行比较插入。 我们日常生活中，打扑克牌的时候就有直接插入排序的思想。当我们摸了一张牌后，会将它与前面已经插入进来的数字进行比较，进行插入。

代码实现如下：

java 复制代码

/**
     * 时间复杂度O(n^2)
     *    最好的情况下时间复杂度：O(n)
     *     当数据基本有序时，直接插入排序速度很快
     *      一般使用场景就是，数据基本趋于有序，建议使用直接插入排序
     *
     *     空间复杂度O(1)
     *     稳定性：稳定
     * @param array
     */
    public static void insertSort(int[] array) {
        for (int i = 1; i < array.length; i++) {
            int j = i-1;
            int tmp = array[i];
            while (j != -1) {
                if (array[j] > tmp) {
                    array[j+1] = array[j];
                    j--;
                } else {
                    //array[j+1] = tmp;
                    break;
                }
            }
            array[j+1] = tmp;
        }
    }

相关特性总结：

时间复杂度：O（n^2）当数据本身有序时，时间复杂度：O（n）

空间复杂度：O（1）

稳定性：稳定

应用场景：数据基本趋于有序，建议使用直接插入排序

2.1.2 希尔排序：

基本思想 ：希尔排序又称为缩小增量法，希尔排序的基本思想就是：先选定一个整数gap，将待排数据分为多个组，所有距离为gap的组为一组，然后每组里面进行排序，然后gap/2，再进行排序，依次类推，当gap=1时，所有数据已经排好序。

简单理解就是按gap分组，然后分组内进行插入排序，当gap=1时，就是直接插入排序。

代码实现：

java 复制代码

 public static void shellSort(int[] array) {
        int gap = array.length;
        while(gap > 1) {
            shell(array,gap);
            gap /= 2;
        }
        shell(array,1);
    }

    /**
     * 时间复杂度： O(n^1.3)-O(n^1.5)
     * 空间复杂度：O(1)
     * 稳定性：不稳定
     * @param array
     * @param gap
     */
    public static void shell(int[] array,int gap) {
        for (int  i = gap; i < array.length; i++) {
            int j = i - gap;
            int tmp = array[i];
            while (j >= 0) {
                if (array[j] > tmp) {
                    array[j+gap] = array[j];
                    j -= gap;
                } else {
                    array[j+gap] = tmp;
                    break;
                }
            }
            array[j+gap] = tmp;
        }
    }

特性总结：

时间复杂度：O(n^1.3) - O(n^1.5)

空间复杂度：O（1）

稳定性：不稳定

希尔排序是直接插入排序的优化：gap>1的排序是预排序，使数据趋于有序，gap=1时就是直接插入排序

2.2 选择排序：

2.2.1 选择排序

基本思想：每一次从待排序序列中选出最小或（最大）的元素，放在序列的起始位置，直到全部待排序数据排完。

这里我们的思路是，定义一个minIndex下标用来存储最小值的下标，第一次minIndex为0下标，然后遍历整个待排序序列，当有更小的数据时更新minIndex下标。最后在交换起始位置和minIndex下标的值。下面是代码实现。

java 复制代码

/**
     * 时间复杂度：O(n^2)
     *空间复杂度：O(1)
     * 稳定性：不稳定
     * @param array
     */
    public static void selectSort(int[] array) {
        for (int i = 0; i < array.length; i++) {
            int minIndex = i;
            for (int j = i + 1; j < array.length; j++) {
                if (array[j] < array[minIndex]) {
                    minIndex = j; //更新minIndex下标
                }
            }
            swap(array,i,minIndex);
        }
    }
    public static void swap(int[] array,int i, int j) {
          int tmp  = array[i];
          array[i] = array[j];
          array[j] = tmp;
    }

特性总结：

时间复杂度：O（n^2）

空间复杂度：O（1）

稳定性：不稳定

2.2.2 堆排序

基本思想：堆排序(Heapsort)是指利用堆积树（堆）这种数据结构所设计的一种排序算法，它是选择排序的一种。它是通过堆来进行选择数据。需要注意的是排升序要建大堆，排降序建小堆

堆排序就是先将我们的数组进行一次建堆，然后循环交互堆顶元素（最大值）与最后一个元素，即交换数组头和尾的元素，然后重新建堆，然后进行交换堆顶元素与最后一个元素，其中我们的最后一个元素是从数组长度进行递减的。如图：

这里演示的第一次交换。

java 复制代码

/**
     * 堆排序
     * 时间复杂度： O(n*logn)
     * 空间复杂度：O(1)
     * 稳定性：不稳定
     * @param array
     */
    public static void heapSort(int[] array) {
         createBigHeap(array);
         int end  = array.length - 1;
         while (end > 0) {
             swap(array,0,end);
             shiftDown(array,0,end);
             end--;
         }

    }

    public static void createBigHeap(int[] array) {
        for (int parent = (array.length-1-1) / 2; parent >= 0; parent--) {
            shiftDown(array,parent,array.length);
        }
    }
   //建大堆
    private static void shiftDown(int[] array, int parent, int len) {
        int child = 2 * parent + 1;
        while (child < len) {
            if (child +1 < len && array[child] < array[child+1]) {
                child++;
            }
            if (array[child] > array[parent]) {
                swap(array,child,parent);
                parent = child;
                child = 2 * parent + 1;
            } else {
                break;
            }
        }

2.3 交换排序

2.3.1 冒泡排序

基本思想：交换排序的基本思想就是将序列中两个数据进行比较，按比较结果来交换序列位置。交换排序的特点是：将键值较大的数据放到序列的尾部位置，将键值较小的数据放到序列的首部位置。

下面我们先看代码演示：

java 复制代码

/**
     * 时间复杂度：O(n^2)
     *空间复杂度：O(1)
     * 稳定性：稳定
     * @param array
     */
public static void bubbleSort(int[] array) {
        for (int i = 0; i < array.length-1; i++) {
          boolean flg  =  false;
            for (int j = 0; j  < array.length - 1 - i; j++) {
                if (array[j] > array[j+1]) {
                    swap(array,j,j+1);
                    flg = true;
                }
            }
            if (flg == false) {
            return ;
            }
        }
    }

注意：

冒泡排序的每一次循环比较是找出最大值或（最小值），将最大值或（最小值）放在尾部（首部）位置。

经过n次比较后，数据变成有序的。

优化：当数据本身是有序的时候，我们可以定义一个flg进行判断，如果一次交换都没有，则表明序列已经有序，直接返回。

2.3.2 快速排序

基本思想：任取待排序序列中的一个元素作为基准值，按照该基准将待排序序列分为两个序列，左子序列的元素值都小于该基准值，右子序列的元素值都大于该基准值。然后在左右子序列中重复该过程，直到所有元素在相应的位置上。
主体框架：

java 复制代码

// 假设按照升序对array数组中[left, right]区间中的元素进行排序
public void quickSort(int[] nums) {
    int left = 0;
    int right = nums.length - 1;
    quick(nums,left,right);
}
public void quick(int[] array, int left, int right)
{
  if(left >= right)
    return;
 
  // 按照基准值对array数组的 [left, right]区间中的元素进行划分
  int pivot = partion(array, left, right);
 
  // 划分成功后以pivot为边界形成了左右两部分 [left, pivot-1] 和 [pivot+1, right)
  // 递归排[left, pivot - 1)
  quick(array, left, pivot - 1);
 
  // 递归排[pivot + 1, right)
  quick(array, pivot+1, right);
}

上面是快排的主框架，我们不难看出，这和二叉树的前序遍历（递归实现）的很像，所以当我们写快排的时候可以联想下二叉树的前序遍历是怎么写的。接下来我们就介绍下找基准值的方法，在快排中有以下几种找基准的方法：

2.3.2.1 hoare法

步骤：

① 先取最左侧的值为基准值

②让right指针从最右侧开始往前走，找到比基准值小的元素停下，left指针从最左侧开始往后走，找到比基准值大的元素停下。交换left下标和right下标的值。

③当left>=right的时候循环停下，即找到了基准值的对应下标，此时交换基准值初始下标和此时的下标即left(或right)的值即可。

代码实现：

java 复制代码

   //hoare法
   public static int partition(int[] array,int left,int right) {
           int tmp = array[left];
           int i = left;
           while (left < right) {
                //找到比基准值大的元素
               while (left < right && array[right] >= tmp) {
                   right--;
               }
               //找到比基准值小的元素
               while (left < right && array[left] <= tmp) {
                   left++;
               }
               //交换这两个元素
               swap(array,left,right);
           }
           swap(array,left,i);
           return left;
   }

hoare法，是定义两个标志位，right从右往左找到比基准值小的值停下来，然后left从左往右找到比基准值大的值停下来，交换left位置和right位置的值，然后循环继续，直到left和right相遇，最后再交换基准值和相遇处的值。再对左右子序列重复此过程，直到数据变成有序。下面，我们用图演示。

2.3.2.2 挖坑法

步骤：

①取最左侧的元素为基准值

②right下标从序列最右侧开始往前遍历找到比基准值小的下标停下，将left下标处的值赋值为right下标的值，left下标从序列最左侧开始往后遍历找到比基准值大的下标停下，将right下标处的值赋值为left下标的值，如此循环。

③当left>=right时，将left(或right)下标的值赋值为基准值

代码实现：

java 复制代码

   //挖坑法
   public static int partition(int[] array,int left,int right) {
        int tmp = array[left];
        while (left < right) {
           while (left < right && array[right] >= tmp) {
               right--;
           } //找到比tmp小的下标
            array[left]  = array[right];
           while (left < right && array[left] <= tmp) {
               left++;
           } //找到比tmp大的下标
           array[right] = array[left];
       }
        array[left] = tmp;
        return  left;
   }

下面我们用图演示。

第三种方法是前后指针法，这个方法了解即可。

java 复制代码

//前后指针法 【了解即可】
    private static int partition3(int[] array,int left,int right) {
        int prev = left ;
        int cur = left+1;
        while (cur <= right) {
            if(array[cur] < array[left] && array[++prev] != array[cur]) {
                swap(array,cur,prev);
            }
            cur++;
        }
        swap(array,prev,left);
        return prev;
    }

2.3.2.3 快排的优化：

因为快排的基准是随机取的，一般情况下，快排的时间复杂度为nlog(n)，当一些情况下会变成O（n^2）,比如数据本身是有序的，为1，2，3，，4...。
这里我们可以用二叉树来理解，

一般情况下，基准到达对应的位置后，序列被分为了左右子序列，此时时间复杂度为O(n log（n）)。但也有特殊情况，如下：

当我们只有一个分支的时候，此时树的高度就是结点的个数，此时的时间复杂度变为了O(n^2)。而当数据量足够大的时候，比如100万，此时我们上述的代码就跑不过了。
优化方法：
1.三数取中法：

我们可以取left,right，和mid中第二大的值为基准进行快排，这样就不会出现，所有数据都在一个子序列上的情况了。

java 复制代码

 public static void quick(int[] array,int start,int end) {
        if (start >= end) {
            return ;
        }
        int index = midThree(array,start,end);
        swap(array,start,index);
        int pivot = partition1(array,start,end);

        quick(array,start,pivot - 1);
        quick(array,pivot + 1,end);
   }
    private static int midThree(int[] array,int left,int right) {
        int mid = (left+right) / 2;
        if(array[left] < array[right]) {
            if(array[mid] < array[left]) {
                return left;
            }else if(array[mid] > array[right]) {
                return right;
            }else {
                return mid;
            }
        }else {
            //array[left] > array[right]
            if(array[mid] < array[right]) {
                return right;
            }else if(array[mid] > array[left]) {
                return left;
            }else {
                return mid;
            }
        }

    }

2.递归到小的子区间时用插入排序：

我们知道当递归到较小的区间的时候，数据是渐渐趋于有序的，而我们在上面说过，当数据趋于有序的时候，建议使用直接插入排序。这样效率比较高。在java底层中是当子区间小于47的时候使用直接插入排序
特性总结：

时间复杂度：O（N*logN）

空间复杂度：O（logN）

稳定性：不稳定

快排整体的综合性能和应用场景都是比较好的，所以才敢叫快速排序。

2.3.3 快排的非递归实现

java 复制代码

//非递归实现快排
    public static void quickSort1(int[] array) {
        Deque<Integer> stack = new LinkedList<>();
         int left = 0;
         int right = array.length - 1;
         int pivot = partition(array,left,right);
         if (pivot > left + 1) {
             stack.push(left);
             stack.push(pivot - 1);
         }
         if (pivot < right-1) {
             stack.push(pivot+1);
             stack.push(right);
         }
         while (!stack.isEmpty()) {
              right = stack.pop();
              left = stack.pop();
              pivot = partition(array,left,right);
             if (pivot > left + 1) {
                 stack.push(left);
                 stack.push(pivot - 1);
             }
             if (pivot < right-1) {
                 stack.push(pivot+1);
                 stack.push(right);
             }
         }
    }

2.4 归并排序

2.4.1 基本思想

归并排序是建立在归并操作上的一种有效的算法，该算法是分治法的一种典型应用。将已有序的子序列合并，得到完全有序的序列：即先使每个子序列有序，再使子序列段间有序，最后将两个有序表合并为一个有序表，称为二路归并。

我们先上图理解：

2.4.2 递归实现归并排序

代码实现：

java 复制代码

//归并排序
    public static void mergeSort(int[] array) {
          mergeSortFunc(array,0,array.length-1);
    }
    //分解
    public static void mergeSortFunc(int[] array,int left,int right) {
        if (left >= right) {
            return ;
        }
        int mid = (left + right) / 2;
        mergeSortFunc(array,left,mid);
        mergeSortFunc(array,mid+1,right);
        merge(array,left,right,mid);
    }
   //归并
    public static void merge(int[] array,int start,int end,int mid) {
        int s1 = start;
        //int e1 = mid;
        int s2 = mid+1;
        //int e2 = end;
        int[] tmp = new int[end-start+1];
        int k = 0;//tmp数组的下标
        while (s1 <= mid && s2 <= end) {
            if(array[s1] <= array[s2]) {
                tmp[k++] = array[s1++];
            }else {
                tmp[k++] = array[s2++];
            }
        }
        while (s1 <= mid) {
            tmp[k++] = array[s1++];
        }
        while (s2 <= end) {
            tmp[k++] = array[s2++];
        }

        for (int i = 0; i < tmp.length; i++) {
            array[i+start] = tmp[i];
        }
    }

特性总结：

时间复杂度：O（N*logN)

空间复杂度：O（N）

稳定性：稳定

应用场景：当待排序数据特别大时，比如内存只有1G，而要排序的数据有100G，此时我们可以将待处理的数据分为200份，每份512M，利用归并排序分别对这512M的数据进行排序，然后同时进行二路归并。最后数据变为有序。所以归并排序用于解决磁盘中的外排序问题。

好了，写到这里，排序这一章节就结束了。感谢支持！