排序第五篇 归并排序

一 简介

归并排序(Merge Sort) 的基本思想是: 首先将待排序文件看成 n n n 个长度为1的有序子文件, 把这些子文件两两归并, 得到 n 2 \frac{n}{2} 2n 个长度为 2 的有序子文件;

然后再把这 n 2 \frac{n}{2} 2n 个有序的子文件两两归并, 如此反复,直到最后得到一个长度为 n n n 的有序文件为止, 这种排序方法称为二路归并排序

在本文中,我们讨论的归并排序特指二路归并排序. 看一个示意图:

二 实现过程

归并排序的核心操作是将数组中前后相邻的两个有序序列归并为一个有序序列.

以java为例,看一个demo。

java 复制代码
public class MergeSort {

    public static void main(String[] args) {
        Integer[] array = new Integer[]{30,45,10,30,50};
        System.out.println("归并排序初始顺序\n"+ Arrays.toString(array));
        mergeSort(array);
        System.out.println("归并排序最后顺序\n"+Arrays.toString(array));
    }

    static void mergeSort(Integer[] arr) {
        sort(arr, 0, arr.length - 1);
    }

    /***
     * 将两个有序序列归并为一个有序序列
     */
    static void sort(Integer[] arr, int low, int high) {
        if (low >= high) {
            return;
        }
        int mid = low + (high - low) / 2;
        sort(arr, low, mid);
        sort(arr, mid + 1, high);
        merge(arr, low, mid, high);
    }

    static void merge(Integer[] arr, int low, int mid, int high) {
        //定义了一个临时数组
        int[] temp = new int[high - low + 1];
        int i = low, j = mid + 1, k = 0;

        while (i <= mid && j <= high) {
            temp[k++] = arr[i] <= arr[j] ? arr[i++] : arr[j++];
        }
        while (i <= mid) {
            //将原数组从下标 low~middle 中剩余的复制到 temp
            temp[k++] = arr[i++];
        }
        while (j <= high) {
            //将原数组从下标 middle+1 ~ high 中剩余的复制到 temp
            temp[k++] = arr[j++];
        }

        for (i = 0; i < k; i++) {
            arr[low + i] = temp[i];
        }
    }
}

程序运行结果

归并排序算法

归并排序算法可看作递归算法, 虽然有的书写成不是递归算法同样实现了。

三 步骤

第一步: 一趟归并排序的基本思想是, 在某趟归并中, 设各子文件长度为len(最后一个子文件的长度可能会小于len), 则归并前 R [ 1.. n ] R[1..n] R[1..n] 共有 n l e n \frac{n}{len} lenn 个有序子文件。 调用归并操作对子文件进行归并时, 必须对子文件的个数可能是奇数、最后一个子文件和长度可能小于 l e n len len 这两种特殊情况进行处理:

  1. 若子文件个数为奇数,则最后个子文件无需和其他子文件归并;
  2. 若子文件个数为偶数,则要注意最后一对子文件中后一个子文件的区间上界为 n n n.

第二步: 归并排序的过程需要进行 l o g 2 log_{2} log2 n {n} n 趟。 每一趟排序的操作,就是将两个有序子文件进行归并,
而每一对有序子文件归并时,
记录的比较次数均小于等于记录的移动次数,
记录移动的次数均等于文件中记录的个数, 即每一趟归并的时间复杂度为 O ( n ) O(n) O(n)

因此归并排序的时间复杂度为 O ( n l o g 2 O(nlog_{2} O(nlog2 n n n ) ) ).

从上述例子可以看出, 空间复杂度为 O ( n ) O(n) O(n)

归并排序是稳定的, 因为在每两个有序子文件 归并时, 若分别在两个有序子文件中出现有相同关键字的记录时, 归并排序算法能够使前一个子文件中同一关键字的记录被先复制,后一子文件中同一关键字的记录后被复制,从而确保它们的相对次序不变。

四 归并算法的优缺点

优点

  1. 适合于大规模数据量,并且要求稳定。
  2. 在基于比较的算法中是最高效率。

缺点

需要数据集长度的辅助空间, 在一定程度上增加了空间复杂度。

如果初始数据几乎填满整个内存,归并排序可能无法工作。

综上,归并算法是应用于大规模数据集最好的排序算法

相关推荐
ZTLJQ5 分钟前
基于机器学习的三国时期诸葛亮北伐失败因素量化分析
人工智能·算法·机器学习
JohnFF28 分钟前
48. 旋转图像
数据结构·算法·leetcode
bbc12122628 分钟前
AT_abc306_b [ABC306B] Base 2
算法
生锈的键盘37 分钟前
推荐算法实践:movielens数据集
算法
董董灿是个攻城狮37 分钟前
Transformer 通关秘籍9:词向量的数值实际上是特征
算法
林泽毅1 小时前
SwanLab x EasyR1:多模态LLM强化学习后训练组合拳,让模型进化更高效
算法·llm·强化学习
小林熬夜学编程1 小时前
【高并发内存池】第八弹---脱离new的定长内存池与多线程malloc测试
c语言·开发语言·数据结构·c++·算法·哈希算法
刚入门的大一新生1 小时前
归并排序延伸-非递归版本
算法·排序算法
独好紫罗兰1 小时前
洛谷题单3-P1980 [NOIP 2013 普及组] 计数问题-python-流程图重构
开发语言·python·算法
独好紫罗兰1 小时前
洛谷题单3-P1009 [NOIP 1998 普及组] 阶乘之和-python-流程图重构
开发语言·python·算法