【数据结构】排序算法系列——希尔排序(附源码+图解)

希尔排序

算法思想

希尔排序(Shell Sort)是一种改进的插入排序算法 ,希尔排序的创造者Donald Shell想出了这个极具创造力的改进。其时间复杂度取决于步长序列(gap)的选择。我们在插入排序中,会发现是对整体数据直接进行了统一的插入排序,每个数据之间的间隙是1 ,这里的1 指的就是步长序列gap 。在希尔排序 中,我们会将整体数据一分为多份,进行散布式的插入排序,这时候每一个子序列之间的间隙就是gap ------那么事实上我们也可以将插入排序就看成是gap=1的希尔排序。

我们来具体分析希尔排序的算法步骤:

  • 将待排序序列分为若干个序列,每个序列的间距n(gap)需要相同
  • 将这些子序列分别进行插入排序
  • 不断减小这个间距

那么我们减小这个间距的目的是什么呢?

gap > 1 时我们可以称为预排序 ,目的是让数组更接近于有序 。当gap = 1 时,数组已经接近有序的了,就整体而言,最后一次整体的插入排序就可以大大提高效率------我们从插入排序的时间复杂度分析也可以看出,越接近有序,插入排序的效率就越高,从而可以达到优化的效果。

图解

可以看到每次减小gap的规律是将原先的gap/2,但事实上这只是其中一种处理方法,并不说明这是最优解。

C语言代码分析

c 复制代码
//与插入排序类似,只是插入排序的间隔是1,而希尔排序的间隔是gap

//第一种思想:依次排序
//排完一组后,再排下一组
void ShellSort1(int arr[], int n)
{
	int gap = 3;//任意一个想要的间隔
	for (int j; j < gap; j++)
	{
		for (int i = gap; i < n; i += gap)
		{

			int end = i - gap;
			int tmp = arr[end + gap];
			while (end >= 0)
			{
				if (tmp >= arr[end])
				{
					arr[end + gap] = tmp;
					end -= gap;
				}
				else
				{
					break;
				}
			}
			arr[end + gap] = tmp;
		}
	}


}

//第二种思想:多组并排
void ShellSort2(int arr[], int n)
{
	int gap = 3;//任意一个想要的间隔
	
		for (int i = gap; i < n-gap; i ++)
		{

			int end = i;
			int tmp = arr[i + gap];
			while (end >= 0)
			{
				if (tmp >= arr[end])
				{
					arr[end + gap] = tmp;
					end -= gap;
				}
				else
				{
					break;
				}
			}
			arr[end + gap] = tmp;
		}
}

//gap越大,跳得越快,但一次排下来最无序
//gap越小,跳得越慢,但一次排下来更有序

注意

希尔排序实际上是个相当复杂的排序算法,这主要是跟它的步长序列gap到底该如何取、后续应该减小有关。这其中涉及到很多的数学分析以及数学公式,我们可以参考严蔚敏老师的解读:

以及殷人昆老师:

所以,本篇文章仅对其基本的算法思想和代码编写进行解析,如有兴趣深究希尔排序,各位读者们可以自行上网搜索有关知识~

时间复杂度

一般情况下,希尔排序的时间复杂度可以表示为:

  • 最好情况(已排序的情况):O(n log n)
  • 平均情况:取决于步长序列的选择,通常为**O(n1.3)-O(n2)**之间。
  • 最坏情况:O(n2)

希尔排序通过逐步减少步长来实现排序,初始的大步长使得数组元素可以较快地达到部分有序状态,最终通过小步长的插入排序完成排序。所以时间复杂度的具体分析也就取决于步长序列。

这里针对平均情况,我们进行一下简单的具体分析:

希尔排序的平均情况时间复杂度是比较复杂的。在实际应用中,常见的步长序列如希尔建议的序列 (1, 3, 7, ..., 2^k-1)或者Hibbard序列 (1, 3, 7, 15, ..., 2k-1)等,它们的时间复杂度通常就在**O(n1.3)-O(n2)**之间,这是经过数学算出来的结果。这些序列被设计为逐渐减小,从而在较早阶段快速减少逆序对的数量,然后在最后阶段完成排序。

总体来说,希尔排序的性能高度依赖于步长序列 的选择。良好的步长序列可以显著改善排序的效率,使得平均情况下的时间复杂度能够在O(n^1.3)左右,而不好的选择则可能导致接近最坏情况的性能。

稳定性

鉴于希尔排序会改变前后元素的相对位置,所以:不稳定

相关推荐
Y40900116 分钟前
C语言转Java语言,相同与相异之处
java·c语言·开发语言·笔记
YuTaoShao17 分钟前
【LeetCode 热题 100】994. 腐烂的橘子——BFS
java·linux·算法·leetcode·宽度优先
Wendy14418 小时前
【线性回归(最小二乘法MSE)】——机器学习
算法·机器学习·线性回归
拾光拾趣录8 小时前
括号生成算法
前端·算法
棐木8 小时前
【C语言】动态内存管理
c语言·free·malloc·realloc·calloc·动态内存
渣呵9 小时前
求不重叠区间总和最大值
算法
拾光拾趣录9 小时前
链表合并:双指针与递归
前端·javascript·算法
好易学·数据结构9 小时前
可视化图解算法56:岛屿数量
数据结构·算法·leetcode·力扣·回溯·牛客网
香蕉可乐荷包蛋10 小时前
AI算法之图像识别与分类
人工智能·学习·算法
chuxinweihui10 小时前
stack,queue,priority_queue的模拟实现及常用接口
算法