排序第五篇 归并排序

一 简介

归并排序(Merge Sort) 的基本思想是: 首先将待排序文件看成 n n n 个长度为1的有序子文件, 把这些子文件两两归并, 得到 n 2 \frac{n}{2} 2n 个长度为 2 的有序子文件;

然后再把这 n 2 \frac{n}{2} 2n 个有序的子文件两两归并, 如此反复,直到最后得到一个长度为 n n n 的有序文件为止, 这种排序方法称为二路归并排序

在本文中,我们讨论的归并排序特指二路归并排序. 看一个示意图:

二 实现过程

归并排序的核心操作是将数组中前后相邻的两个有序序列归并为一个有序序列.

以java为例,看一个demo。

java 复制代码
public class MergeSort {

    public static void main(String[] args) {
        Integer[] array = new Integer[]{30,45,10,30,50};
        System.out.println("归并排序初始顺序\n"+ Arrays.toString(array));
        mergeSort(array);
        System.out.println("归并排序最后顺序\n"+Arrays.toString(array));
    }

    static void mergeSort(Integer[] arr) {
        sort(arr, 0, arr.length - 1);
    }

    /***
     * 将两个有序序列归并为一个有序序列
     */
    static void sort(Integer[] arr, int low, int high) {
        if (low >= high) {
            return;
        }
        int mid = low + (high - low) / 2;
        sort(arr, low, mid);
        sort(arr, mid + 1, high);
        merge(arr, low, mid, high);
    }

    static void merge(Integer[] arr, int low, int mid, int high) {
        //定义了一个临时数组
        int[] temp = new int[high - low + 1];
        int i = low, j = mid + 1, k = 0;

        while (i <= mid && j <= high) {
            temp[k++] = arr[i] <= arr[j] ? arr[i++] : arr[j++];
        }
        while (i <= mid) {
            //将原数组从下标 low~middle 中剩余的复制到 temp
            temp[k++] = arr[i++];
        }
        while (j <= high) {
            //将原数组从下标 middle+1 ~ high 中剩余的复制到 temp
            temp[k++] = arr[j++];
        }

        for (i = 0; i < k; i++) {
            arr[low + i] = temp[i];
        }
    }
}

程序运行结果

归并排序算法

归并排序算法可看作递归算法, 虽然有的书写成不是递归算法同样实现了。

三 步骤

第一步: 一趟归并排序的基本思想是, 在某趟归并中, 设各子文件长度为len(最后一个子文件的长度可能会小于len), 则归并前 R [ 1.. n ] R[1..n] R[1..n] 共有 n l e n \frac{n}{len} lenn 个有序子文件。 调用归并操作对子文件进行归并时, 必须对子文件的个数可能是奇数、最后一个子文件和长度可能小于 l e n len len 这两种特殊情况进行处理:

  1. 若子文件个数为奇数,则最后个子文件无需和其他子文件归并;
  2. 若子文件个数为偶数,则要注意最后一对子文件中后一个子文件的区间上界为 n n n.

第二步: 归并排序的过程需要进行 l o g 2 log_{2} log2 n {n} n 趟。 每一趟排序的操作,就是将两个有序子文件进行归并,
而每一对有序子文件归并时,
记录的比较次数均小于等于记录的移动次数,
记录移动的次数均等于文件中记录的个数, 即每一趟归并的时间复杂度为 O ( n ) O(n) O(n)

因此归并排序的时间复杂度为 O ( n l o g 2 O(nlog_{2} O(nlog2 n n n ) ) ).

从上述例子可以看出, 空间复杂度为 O ( n ) O(n) O(n)

归并排序是稳定的, 因为在每两个有序子文件 归并时, 若分别在两个有序子文件中出现有相同关键字的记录时, 归并排序算法能够使前一个子文件中同一关键字的记录被先复制,后一子文件中同一关键字的记录后被复制,从而确保它们的相对次序不变。

四 归并算法的优缺点

优点

  1. 适合于大规模数据量,并且要求稳定。
  2. 在基于比较的算法中是最高效率。

缺点

需要数据集长度的辅助空间, 在一定程度上增加了空间复杂度。

如果初始数据几乎填满整个内存,归并排序可能无法工作。

综上,归并算法是应用于大规模数据集最好的排序算法

相关推荐
钢板兽8 分钟前
力扣hot100——子串、普通数组、矩阵
java·后端·算法·leetcode·面试·矩阵
丶重明10 分钟前
【Go每日一练】实现简单的控制台计算器
服务器·算法·golang
小竹子1424 分钟前
L3-1 夺宝大赛
数据结构·算法·图论
LDG_AGI32 分钟前
【深度学习】多元物料融合算法(一):量纲对齐常见方法
人工智能·深度学习·算法·机器学习·均值算法·哈希算法·启发式算法
EDPJ35 分钟前
(2025|ICLR|厦大&华为,LoSA,基于表示互信息的动态层级稀疏率,基于重构误差的秩分配)LLM 的动态低秩稀疏自适应
深度学习·算法·语言模型
KangkangLoveNLP38 分钟前
从Swish到SwiGLU:激活函数的进化与革命,qwen2.5应用的激活函数
人工智能·深度学习·神经网络·算法·机器学习·自然语言处理·cnn
奔跑的废柴39 分钟前
LeetCode 513. 找树左下角的值 java题解
java·算法·leetcode
Awesome Baron42 分钟前
LeetCode hot 100 每日一题(7)--3. 无重复字符的最长子串
算法·leetcode·职场和发展
SsummerC1 小时前
【leetcode100】组合总和
数据结构·python·算法·leetcode
反方向的钟儿2 小时前
【数学建模】001
笔记·算法·数学建模