一、介绍
**「归并排序mergesort」**是一种基于分治策略的排序算法,包含"划分"和"合并"阶段。
划分阶段:通过递归不断地将数组从中点处分开,将长数组的排序问题转换为短数组的排序问题。
合并阶段:当子数组长度为1时终止划分,开始合并,持续地将左右两个较短的有序数组合并为一个较长的有序数组,直至结束。

二、算法流程
"划分阶段" 从顶至底递归地将数组从中点切分为两个子数组。
计算数组中点mid ,递归划分左子数组(区间[left, mid] )和右子数组(区间[mid + 1, right] )。
递归执行步骤1.,直至子数组区间长度为1时,终止递归划分。
**"合并阶段"**从底至顶地将左子数组和右子数组合并为一个有序数组。需要注意的是,从长度为1的子数组开始合并,合并阶段中的每个子数组都是有序的。
观察发现,归并排序与二叉树后序遍历的递归顺序是一致的。
‧后序遍历:先递归左子树,再递归右子树,最后处理根节点。
‧归并排序:先递归左子数组,再递归右子数组,最后处理合并。
三、完整代码
def merge(nums: list[int], left: int, mid: int, right: int):
"""合并左子数组和右子数组"""
# 左子数组区间为 [left, mid], 右子数组区间为 [mid+1, right]
# 创建一个临时数组 tmp ,用于存放合并后的结果
tmp = [0] * (right - left + 1)
# 初始化左子数组和右子数组的起始索引
i, j, k = left, mid + 1, 0
# 当左右子数组都还有元素时,进行比较并将较小的元素复制到临时数组中
while i <= mid and j <= right:
if nums[i] <= nums[j]:
tmp[k] = nums[i]
i += 1
else:
tmp[k] = nums[j]
j += 1
k += 1
# 将左子数组和右子数组的剩余元素复制到临时数组中
while i <= mid:
tmp[k] = nums[i]
i += 1
k += 1
while j <= right:
tmp[k] = nums[j]
j += 1
k += 1
# 将临时数组 tmp 中的元素复制回原数组 nums 的对应区间
for k in range(0, len(tmp)):
nums[left + k] = tmp[k]
def merge_sort(nums: list[int], left: int, right: int):
"""归并排序"""
# 终止条件
if left >= right:
return # 当子数组长度为 1 时终止递归
# 划分阶段
mid = (left + right) // 2 # 计算中点
merge_sort(nums, left, mid) # 递归左子数组
merge_sort(nums, mid + 1, right) # 递归右子数组
# 合并阶段
merge(nums, left, mid, right)
"""Driver Code"""
if __name__ == "__main__":
nums = [7, 3, 2, 6, 0, 1, 5, 4]
merge_sort(nums, 0, len(nums) - 1)
print("归并排序完成后 nums =", nums)
1)merge_sort 函数的执行顺序是:先完全递归处理左子数组,再完全递归处理右子数组,最后合并左右子数组。
以数组 [3, 1, 4, 2] 的调用栈为例:
merge_sort(0,3) → 调用 merge_sort(0,1)(左子数组)。
merge_sort(0,1) → 调用 merge_sort(0,0)(左子数组)。
merge_sort(0,0) 返回 → 调用 merge_sort(1,1)(右子数组)。
merge_sort(1,1) 返回 → 合并 [0,0] 和 [1,1]。
merge_sort(0,1) 返回 → 调用 merge_sort(2,3)(右子数组)。
递归处理右子数组的过程类似,最终合并整个数组。
2)实现合并函数 merge() 存在以下难点。
‧ 需要特别注意各个变量的含义。 nums 的待合并区间为[left, right] ,但由于 tmp 仅复制了 nums 该区间的元素,因此tmp对应区间为[0, right- left] 。
‧ 在比较 tmp[i] 和 tmp[j] 的大小时,还需考虑子数组遍历完成后的索引越界问题,即 i > leftEnd 和 j > rightEnd 的情况。索引越界的优先级是最高的,如果左子数组已经被合并完了,那么不需要继续比较,直接合并右子数组元素即可。
四、算法特性
‧ 时间复杂度𝑂(𝑛log𝑛)、非自适应排序 :划分产生高度为log𝑛的递归树,每层合并的总操作数量为n,因此总体时间复杂度为𝑂(𝑛log𝑛)。
‧ 空间复杂度𝑂(𝑛)、非原地排序 :递归深度为log𝑛,使用𝑂(log𝑛)大小的栈帧空间。合并操作需要借助辅助数组实现,使用𝑂(𝑛)大小的额外空间。
‧ 稳定排序:在合并过程中,相等元素的次序保持不变。