排序第五篇 归并排序

一 简介

归并排序(Merge Sort) 的基本思想是: 首先将待排序文件看成 n n n 个长度为1的有序子文件, 把这些子文件两两归并, 得到 n 2 \frac{n}{2} 2n 个长度为 2 的有序子文件;

然后再把这 n 2 \frac{n}{2} 2n 个有序的子文件两两归并, 如此反复,直到最后得到一个长度为 n n n 的有序文件为止, 这种排序方法称为二路归并排序

在本文中,我们讨论的归并排序特指二路归并排序. 看一个示意图:

二 实现过程

归并排序的核心操作是将数组中前后相邻的两个有序序列归并为一个有序序列.

以java为例,看一个demo。

java 复制代码
public class MergeSort {

    public static void main(String[] args) {
        Integer[] array = new Integer[]{30,45,10,30,50};
        System.out.println("归并排序初始顺序\n"+ Arrays.toString(array));
        mergeSort(array);
        System.out.println("归并排序最后顺序\n"+Arrays.toString(array));
    }

    static void mergeSort(Integer[] arr) {
        sort(arr, 0, arr.length - 1);
    }

    /***
     * 将两个有序序列归并为一个有序序列
     */
    static void sort(Integer[] arr, int low, int high) {
        if (low >= high) {
            return;
        }
        int mid = low + (high - low) / 2;
        sort(arr, low, mid);
        sort(arr, mid + 1, high);
        merge(arr, low, mid, high);
    }

    static void merge(Integer[] arr, int low, int mid, int high) {
        //定义了一个临时数组
        int[] temp = new int[high - low + 1];
        int i = low, j = mid + 1, k = 0;

        while (i <= mid && j <= high) {
            temp[k++] = arr[i] <= arr[j] ? arr[i++] : arr[j++];
        }
        while (i <= mid) {
            //将原数组从下标 low~middle 中剩余的复制到 temp
            temp[k++] = arr[i++];
        }
        while (j <= high) {
            //将原数组从下标 middle+1 ~ high 中剩余的复制到 temp
            temp[k++] = arr[j++];
        }

        for (i = 0; i < k; i++) {
            arr[low + i] = temp[i];
        }
    }
}

程序运行结果

归并排序算法

归并排序算法可看作递归算法, 虽然有的书写成不是递归算法同样实现了。

三 步骤

第一步: 一趟归并排序的基本思想是, 在某趟归并中, 设各子文件长度为len(最后一个子文件的长度可能会小于len), 则归并前 R [ 1.. n ] R[1..n] R[1..n] 共有 n l e n \frac{n}{len} lenn 个有序子文件。 调用归并操作对子文件进行归并时, 必须对子文件的个数可能是奇数、最后一个子文件和长度可能小于 l e n len len 这两种特殊情况进行处理:

  1. 若子文件个数为奇数,则最后个子文件无需和其他子文件归并;
  2. 若子文件个数为偶数,则要注意最后一对子文件中后一个子文件的区间上界为 n n n.

第二步: 归并排序的过程需要进行 l o g 2 log_{2} log2 n {n} n 趟。 每一趟排序的操作,就是将两个有序子文件进行归并,
而每一对有序子文件归并时,
记录的比较次数均小于等于记录的移动次数,
记录移动的次数均等于文件中记录的个数, 即每一趟归并的时间复杂度为 O ( n ) O(n) O(n)

因此归并排序的时间复杂度为 O ( n l o g 2 O(nlog_{2} O(nlog2 n n n ) ) ).

从上述例子可以看出, 空间复杂度为 O ( n ) O(n) O(n)

归并排序是稳定的, 因为在每两个有序子文件 归并时, 若分别在两个有序子文件中出现有相同关键字的记录时, 归并排序算法能够使前一个子文件中同一关键字的记录被先复制,后一子文件中同一关键字的记录后被复制,从而确保它们的相对次序不变。

四 归并算法的优缺点

优点

  1. 适合于大规模数据量,并且要求稳定。
  2. 在基于比较的算法中是最高效率。

缺点

需要数据集长度的辅助空间, 在一定程度上增加了空间复杂度。

如果初始数据几乎填满整个内存,归并排序可能无法工作。

综上,归并算法是应用于大规模数据集最好的排序算法

相关推荐
lu_rong_qq4 分钟前
决策树 DecisionTreeClassifier() 模型参数介绍
算法·决策树·机器学习
Heisenberg~6 分钟前
详解八大排序(五)------(计数排序,时间复杂度)
c语言·数据结构·排序算法
LNTON羚通6 小时前
摄像机视频分析软件下载LiteAIServer视频智能分析平台玩手机打电话检测算法技术的实现
算法·目标检测·音视频·监控·视频监控
哭泣的眼泪4087 小时前
解析粗糙度仪在工业制造及材料科学和建筑工程领域的重要性
python·算法·django·virtualenv·pygame
Microsoft Word8 小时前
c++基础语法
开发语言·c++·算法
天才在此8 小时前
汽车加油行驶问题-动态规划算法(已在洛谷AC)
算法·动态规划
莫叫石榴姐9 小时前
数据科学与SQL:组距分组分析 | 区间分布问题
大数据·人工智能·sql·深度学习·算法·机器学习·数据挖掘
茶猫_10 小时前
力扣面试题 - 25 二进制数转字符串
c语言·算法·leetcode·职场和发展
肥猪猪爸12 小时前
使用卡尔曼滤波器估计pybullet中的机器人位置
数据结构·人工智能·python·算法·机器人·卡尔曼滤波·pybullet
readmancynn12 小时前
二分基本实现
数据结构·算法