排序第五篇 归并排序

一 简介

归并排序(Merge Sort) 的基本思想是: 首先将待排序文件看成 n n n 个长度为1的有序子文件, 把这些子文件两两归并, 得到 n 2 \frac{n}{2} 2n 个长度为 2 的有序子文件;

然后再把这 n 2 \frac{n}{2} 2n 个有序的子文件两两归并, 如此反复,直到最后得到一个长度为 n n n 的有序文件为止, 这种排序方法称为二路归并排序

在本文中,我们讨论的归并排序特指二路归并排序. 看一个示意图:

二 实现过程

归并排序的核心操作是将数组中前后相邻的两个有序序列归并为一个有序序列.

以java为例,看一个demo。

java 复制代码
public class MergeSort {

    public static void main(String[] args) {
        Integer[] array = new Integer[]{30,45,10,30,50};
        System.out.println("归并排序初始顺序\n"+ Arrays.toString(array));
        mergeSort(array);
        System.out.println("归并排序最后顺序\n"+Arrays.toString(array));
    }

    static void mergeSort(Integer[] arr) {
        sort(arr, 0, arr.length - 1);
    }

    /***
     * 将两个有序序列归并为一个有序序列
     */
    static void sort(Integer[] arr, int low, int high) {
        if (low >= high) {
            return;
        }
        int mid = low + (high - low) / 2;
        sort(arr, low, mid);
        sort(arr, mid + 1, high);
        merge(arr, low, mid, high);
    }

    static void merge(Integer[] arr, int low, int mid, int high) {
        //定义了一个临时数组
        int[] temp = new int[high - low + 1];
        int i = low, j = mid + 1, k = 0;

        while (i <= mid && j <= high) {
            temp[k++] = arr[i] <= arr[j] ? arr[i++] : arr[j++];
        }
        while (i <= mid) {
            //将原数组从下标 low~middle 中剩余的复制到 temp
            temp[k++] = arr[i++];
        }
        while (j <= high) {
            //将原数组从下标 middle+1 ~ high 中剩余的复制到 temp
            temp[k++] = arr[j++];
        }

        for (i = 0; i < k; i++) {
            arr[low + i] = temp[i];
        }
    }
}

程序运行结果

归并排序算法

归并排序算法可看作递归算法, 虽然有的书写成不是递归算法同样实现了。

三 步骤

第一步: 一趟归并排序的基本思想是, 在某趟归并中, 设各子文件长度为len(最后一个子文件的长度可能会小于len), 则归并前 R [ 1.. n ] R[1..n] R[1..n] 共有 n l e n \frac{n}{len} lenn 个有序子文件。 调用归并操作对子文件进行归并时, 必须对子文件的个数可能是奇数、最后一个子文件和长度可能小于 l e n len len 这两种特殊情况进行处理:

  1. 若子文件个数为奇数,则最后个子文件无需和其他子文件归并;
  2. 若子文件个数为偶数,则要注意最后一对子文件中后一个子文件的区间上界为 n n n.

第二步: 归并排序的过程需要进行 l o g 2 log_{2} log2 n {n} n 趟。 每一趟排序的操作,就是将两个有序子文件进行归并,
而每一对有序子文件归并时,
记录的比较次数均小于等于记录的移动次数,
记录移动的次数均等于文件中记录的个数, 即每一趟归并的时间复杂度为 O ( n ) O(n) O(n)

因此归并排序的时间复杂度为 O ( n l o g 2 O(nlog_{2} O(nlog2 n n n ) ) ).

从上述例子可以看出, 空间复杂度为 O ( n ) O(n) O(n)

归并排序是稳定的, 因为在每两个有序子文件 归并时, 若分别在两个有序子文件中出现有相同关键字的记录时, 归并排序算法能够使前一个子文件中同一关键字的记录被先复制,后一子文件中同一关键字的记录后被复制,从而确保它们的相对次序不变。

四 归并算法的优缺点

优点

  1. 适合于大规模数据量,并且要求稳定。
  2. 在基于比较的算法中是最高效率。

缺点

需要数据集长度的辅助空间, 在一定程度上增加了空间复杂度。

如果初始数据几乎填满整个内存,归并排序可能无法工作。

综上,归并算法是应用于大规模数据集最好的排序算法

相关推荐
Fantasydg几秒前
DAY 35 leetcode 202--哈希表.快乐数
算法·leetcode·散列表
jyyyx的算法博客1 分钟前
Leetcode 2337 -- 双指针 | 脑筋急转弯
算法·leetcode
SweetCode13 分钟前
裴蜀定理:整数解的奥秘
数据结构·python·线性代数·算法·机器学习
ゞ 正在缓冲99%…26 分钟前
leetcode76.最小覆盖子串
java·算法·leetcode·字符串·双指针·滑动窗口
xuanjiong27 分钟前
纯个人整理,蓝桥杯使用的算法模板day2(0-1背包问题),手打个人理解注释,超全面,且均已验证成功(附带详细手写“模拟流程图”,全网首个
算法·蓝桥杯·动态规划
惊鸿.Jh1 小时前
【滑动窗口】3254. 长度为 K 的子数组的能量值 I
数据结构·算法·leetcode
明灯L1 小时前
《函数基础与内存机制深度剖析:从 return 语句到各类经典编程题详解》
经验分享·python·算法·链表·经典例题
碳基学AI1 小时前
哈尔滨工业大学DeepSeek公开课:探索大模型原理、技术与应用从GPT到DeepSeek|附视频与讲义免费下载方法
大数据·人工智能·python·gpt·算法·语言模型·集成学习
补三补四1 小时前
机器学习-聚类分析算法
人工智能·深度学习·算法·机器学习
独好紫罗兰1 小时前
洛谷题单3-P5718 【深基4.例2】找最小值-python-流程图重构
开发语言·python·算法