【初探数据结构】归并排序与计数排序的序曲

💬 欢迎讨论:在阅读过程中有任何疑问,欢迎在评论区留言,我们一起交流学习!

👍 点赞、收藏与分享:如果你觉得这篇文章对你有帮助,记得点赞、收藏,并分享给更多对数据结构感兴趣的朋友!

文章目录

    • 前言
    • [一、归并排序(Merge Sort)](#一、归并排序(Merge Sort))
      • [1. 算法原理](#1. 算法原理)
      • [2. 递归实现](#2. 递归实现)
      • [3. 非递归实现](#3. 非递归实现)
    • [二、计数排序(Count Sort)](#二、计数排序(Count Sort))
      • [1. 算法原理](#1. 算法原理)
      • [2. 代码实现](#2. 代码实现)
    • 三、对比与总结

前言

本文主要内容是归并的递归和非递归以及计数排序的实现方法。文章会提及很多容易忽视的易错点(大多是我自己踩过的坑😂),这是我在学习这块内容时获取的教训和宝贵经验。

因为自己淋过雨,希望能为你们撑把伞!共勉!😁


一、归并排序(Merge Sort)

1. 算法原理

基本思想:

归并排序(MERGE-SORT)是建立在归并操作上的一种有效的排序算法,该算法是采用分治法(Divide and Conquer)的一个非常典型的应用。将已有序的子序列合并,得到完全有序的序列;即先使每个子序列有序,再使子序列段间有序。若将两个有序表合并成一个有序表,称为二路归并。

归并排序核心步骤:

  1. 分解:将数组递归分成两半,直到子数组长度为1。
  2. 合并:将两个有序子数组合并为一个有序数组。

从步骤可以看出,这似乎就是二叉树的后序遍历

不知道你们在学习C语言的时候有没有写过这样一道题
合并两个有序数组

我建议没写过的可以去写一下,这里可以直接抄作业了,O(∩_∩)O哈哈~

2. 递归实现

  1. 首先我们需要开辟一个临时数组,来存储合并的序列

  2. 递归结束条件:数组长度为1时结束
    if (left >= right) return;

  3. mid不要写成(right - left) / 2了,再加上left才能在正确位置(因为这是在计算下标),或者直接用(right+left)/2。------易错点

  4. 确定每次拆分的区间[left,mid] [mid + 1,right]

  5. 递归(后序遍历),

  6. 归并:在tmp上正确的位置进行赋值,不能是cur = 0,否则会覆盖值------易错点

  7. 拷贝,将tmp拷贝到a

c 复制代码
void Merger(int* a, int* tmp, int left, int right)
{
	//递归结束条件
	if (left >= right) {
		return;
	}
	int mid = left + (right - left) / 2;//易错:加上left才能在正确的位置
	//递归(后序遍历)
	//[left,mid] [mid+1,right]
	Merger(a, tmp, left, mid);
	Merger(a, tmp, mid+1, right);
	//归并
 	int begin1 = left, end1 = mid;
	int begin2 = mid + 1, end2 = right;
	int cur = left;//易错:在tmp上正确的位置进行赋值,不能是cur = 0,否则会覆盖值
	while (begin1 <= end1 && begin2 <= end2) {
		if (a[begin1] > a[begin2]) {
			tmp[cur++] = a[begin2++];
		}
		else {
			tmp[cur++] = a[begin1++];
		}
	}
	while (begin1 <= end1) {
		tmp[cur++] = a[begin1++];
	}
	while (begin2 <= end2) {
		tmp[cur++] = a[begin2++];
	}
	//将tmp拷贝到a
	memcpy(a + left, tmp + left, sizeof(int) * (right - left + 1));
}

void MergerSort(int* a, int n)
{
	int* tmp = (int*)malloc(sizeof(int) * n);
	int begin = 0, end = n - 1;
	Merger(a, tmp, begin, end);
	free(tmp);
}

特点

  • 时间复杂度:O(n log n)
  • 空间复杂度:O(n)
  • 稳定排序,适合处理大数据量。

3. 非递归实现

利用迭代(循环)模拟递归过程:

当元素个数不是gap的整数时,会发生越界问题:

设归并的两部分分别为[begin1,end1][begin2,end2]

那么,end1、begin2、end2都可能会越界,因此我们就需要修正边界。

  1. end1越界时,第一部分不完整且第二部分不存在,没必要归并了,直接拷贝即可
  2. begin2越界时,第二部分不存在,没必要归并了,直接拷贝即可
  3. end2越界时,第二部分不完整,将end2修正到数组末尾即可

可以发现,1,2是一类情况,可以一起处理了。

我们需要来抉择一个问题:

  1. 整体归并结束后拷贝
  2. 归并一部分拷贝一部分

这两个问题看似不起眼,实则不然,它会影响你控制边界的难度。可以试试两种方式都写写,会特别爽(狗头)

  1. 归并结束后再拷贝,需精密控制边界越界情况,容易出错。------不推荐该写法
c 复制代码
void MergerSortNonR1(int* a, int n)
{
	int* tmp = (int*)malloc(sizeof(int) * n);
	if (tmp == NULL)
	{
		perror("malloc fail");
		return;
	}
	int gap = 1;
	while (gap < n)
	{
		for (int i = 0; i < n; i += 2 * gap) {
			//归并
			//[i,i+gap-1] [i+gap,i+2*gap-1]
			int begin1 = i, end1 = i + gap - 1;
			int begin2 = i + gap, end2 = i + 2 * gap - 1;
			int cur = i;
			if (end1 >= n) {
				//修正end1
				end1 = n - 1;
				//使得begin2 > end2,终止归并
				begin2 = n;
				end2 = n - 1;
			}
			else if (begin2 >= n) {
				//使得begin2 > end2,终止归并
				begin2 = n;
				end2 = n - 1;
			}
			else if (end2 >= n) {
				//修正end2,继续归并
				end2 = n - 1;
			}
			while (begin1 <= end1 && begin2 <= end2) {
				if (a[begin1] > a[begin2]) {
					tmp[cur++] = a[begin2++];
				}
				else {
					tmp[cur++] = a[begin1++];
				}
			}
			while (begin1 <= end1) {
				tmp[cur++] = a[begin1++];
			}
			while (begin2 <= end2) {
				tmp[cur++] = a[begin2++];
			}
		}
		//归并结束后再打印
		memcpy(a, tmp, sizeof(int) * n);
		gap *= 2;
	}
	free(tmp);
}
  1. 归并一次拷贝一次,若end1begin2有越界情况,直接跳出循环(退出归并)即可无需控制边界情况,操作简单易理解
c 复制代码
void MergerSortNonR(int* a, int n)
{
	int* tmp = (int*)malloc(sizeof(int) * n);
	if (tmp == NULL)
	{
		perror("malloc fail");
		return;
	}
	int gap = 1;
	while (gap < n)
	{
		for (int i = 0; i < n; i += 2 * gap) {
			//归并
			//[i,i+gap-1] [i+gap,i+2*gap-1]
			int begin1 = i, end1 = i + gap - 1;
			int begin2 = i + gap, end2 = i + 2 * gap - 1;
			int cur = i;
			if (end1 >= n || begin2 >= n) {
				break;//直接终止归并
			}
			else if (end2 >= n) {
				//修正end2
				end2 = n - 1;
			}
			while (begin1 <= end1 && begin2 <= end2) {
				if (a[begin1] > a[begin2]) {
					tmp[cur++] = a[begin2++];
				}
				else {
					tmp[cur++] = a[begin1++];
				}
			}
			while (begin1 <= end1) {
				tmp[cur++] = a[begin1++];
			}
			while (begin2 <= end2) {
				tmp[cur++] = a[begin2++];
			}
			//归并一次打印一次
			memcpy(a + i, tmp + i, sizeof(int) * (end2 - i + 1));
		}
		//printf("\n");
		gap *= 2;
	}
	free(tmp);
}

关键点

  • gap 控制合并步长,从1开始逐步扩大。
  • 边界处理:若子数组越界,直接终止合并。

二、计数排序(Count Sort)

思想:计数排序又称为鸽巢原理,是对哈希直接定址法的变形应用。 操作步骤:

  1. 统计相同元素出现次数
  2. 根据统计的结果将序列回收到原来的序列中

1. 算法原理

  1. 确定范围 :找出数组的最小值 min 和最大值 max
  2. 统计频率 :创建计数数组 countA,统计每个元素出现的次数。
  3. 重建数组 :根据计数数组将元素按顺序写回原数组。

2. 代码实现

c 复制代码
void CountSort(int* a, int n) {
    int min = a[0], max = a[0];
    for (int i = 0; i < n; i++) {   // 确定范围
        if (a[i] < min) min = a[i];
        if (a[i] > max) max = a[i];
    }
    int range = max - min + 1;
    int* countA = (int*)calloc(range, sizeof(int));  // 分配计数数组
    for (int i = 0; i < n; i++) countA[a[i] - min]++; // 统计频率
    // 重建数组
    int cur = 0;
    for (int i = 0; i < range; i++) {
        while (countA[i]--) a[cur++] = i + min;
    }
    free(countA);
}

特点

  • 时间复杂度:O(n + k),k 为数据范围。
  • 空间复杂度:O(k)
  • 非比较排序,适合数据范围小且为整数的情况。

三、对比与总结

算法 时间复杂度 空间复杂度 稳定性 适用场景
归并排序 O(n log n) O(n) 稳定 大数据量、需稳定排序
计数排序 O(n + k) O(k) 稳定 小范围整数、非比较排序

希望这篇文章对你有所帮助🌹🌹🌹

相关推荐
Stardep4 分钟前
算法学习11——滑动窗口——最大连续1的个数
数据结构·c++·学习·算法·leetcode·动态规划·牛客网
rigidwill6661 小时前
LeetCode hot 100—二叉搜索树中第K小的元素
数据结构·c++·算法·leetcode·职场和发展
UP_Continue5 小时前
排序--归并排序
数据结构
飞鼠_5 小时前
详解数据结构之树、二叉树、二叉搜索树详解 C++实现
开发语言·数据结构·c++
丶Darling.6 小时前
26考研 | 王道 |数据结构 | 第二章 线性表
数据结构·考研
学也不会6 小时前
d2025331
java·数据结构·算法
Aurora_wmroy7 小时前
算法竞赛备赛——【数据结构】并查集
数据结构·c++·算法·蓝桥杯
pystraf8 小时前
P8310 〈 TREEのOI 2022 Spring 〉Essential Operations Solution
数据结构·c++·算法·线段树·洛谷
·醉挽清风·8 小时前
学习笔记—数据结构—二叉树(链式)
c语言·数据结构·c++·笔记·学习·算法
Susea&8 小时前
数据结构初阶:单链表
c语言·开发语言·数据结构