一篇文章讲透排序算法之快速排序

前言

本篇博客难度较高,建议在学习过程中先阅读一遍思路、浏览一遍动图,之后研究代码,之后仔细体会思路、体会动图。之后再自己进行实现。

一.快排介绍与思想

快速排序相当于一个对冒泡排序的优化,其大体思路是先在文中选取一个数作为基准值,将数组分为两个区间,一个区间比这个数大,另一个区间比这个数小。不断进行这个操作,直到我们的区间内只有一个数为止。

因此,快速排序的步骤如下:

  • 1.先从数列中取出一个数作为基准数。
  • 2.将数组分区间,将比这个数大的数全放到它的右边,小于或等于它的数全放到它的左边。
  • 3.再对左右区间重复这个动作,直到各区间只有一个数。

快速排序有多个版本,分别有hoare大佬创建的版本:hoare版本;便以理解的挖坑法;以及效率很高的前后指针法。我们依次讲解这些版本

二.hoare版本

2.0算法思想

首先,我们定义两个指针,分别指向两个数组的最左侧和最右侧。

之后,让R(小人头盔)去找比key小的数,L去找比key大的数,都找到了之后交换L和R的数。

然后再让他们继续走,继续找,继续交换,直到他们相遇为止。

此时将相遇处的值与key交换,此时相遇处右侧都是比key大的数,左侧都是比key小的数。

整个过程如下:

之后我们选定新的基准值,并不断进行上述动作,即可让大的数在右侧,小的数在左侧。

2.1单趟过程

  • 我们首先选定数组下标为0处的值为基准值
  • 之后便是让right先走,找到较小的数
  • left再走,找到较大的数字
  • 交换left和right的数
  • right再走,找小
  • left再走,找大
  • 相遇时,将相遇处的值和keyi的值交换,并将相遇处的坐标设置为新的新keyi

现在我们将这一个过程实现为代码:

cpp 复制代码
	//keyi-->begin处的数据下标
	int keyi = begin;
	int left = begin;
	int right = end;
	while (left < right)
	{
		//right先走,找小    找小,所以大于的时候要right--
	while(left < right && a[right] >= a[keyi])
	{
		--right;
	}
		//left再走,找大
	while(left < right&& a[left] <= a[keyi])
	{
		--left;
	}
	swap(&a[left], &a[right]);
	}
	keyi = left;

下面我们来剖析一下这段代码

  • 首先,我们的右指针是要找到小了才会停下来的,因此我们需要用到循环才能保证它找到小的时候停下来
  • 我们要找到小的时候停下来,就代表找到小是退出循环的条件,因此我们的条件是a[right] >= a[keyi]
  • 另外,我们一定要在while循环内部判断left<right,否则很容易发生数组越界。

如下图,如果我们不判断等于的话,则会出现死循环;

若我们不判断left<right的话,则很容易走出循环,譬如下图的情况,right一直找不到小,就走出循环了。

然后我们再来分析另外一个问题

如果相遇处的值大于keyi怎么办?它大于keyi的话,交换后不就无法产生一个大一个小的区间了嘛?

我们把这个问题转换一下,即为什么left和right相遇处的值一定小于keyi吗?

我们是让right先走的,这里我们分两种情况讨论:(如果是left先走的话就寄掉了)

1.right遇left,我们可以确保的一点是,right遇到left之前遇到的值都是比keyi的值大的,而left处的值又是小于keyi的,因此相遇时的值小于keyi。

2.left遇right, right先找到小的然后停下来了,之后left遇到它了,这个位置是比keyi处的值小的值。

2.2多趟过程的思想

当上面的单趟走完后,我们会发现,keyi左边的全是小于a[keyi]的,右边全是大于a[keyi]的。

现在我们不断的分区间,不断的重复刚刚的行为,就可以实现对整个数组的排序了,这是一个递归分治的典型。

现在我给大家画图来分析一下下面几趟的过程:

以左半边为例:

第二趟排序:

  • 右边找小,找到3;左边找大,没找到,相遇了
  • 交换2和3的位置
  • 新的key为3
  • 以k为基准,左右分区间

第三趟排序:

右边的找小直接遇到左,然后交换,新的key为2,下一个区间只有一个值。

第四趟排序:只有一个值了,我们可以返回了!

现在我们先不探究返回的条件,先将刚刚的思路完成

cpp 复制代码
void qsort(int* a, int begin, int end)
{
	//keyi-->begin处的数据下标
	int keyi = begin;
	int left = begin;
	int right = end;
	while (left < right)
	{
		//right先走,找小
	while(left < right && a[right] >= a[keyi])
	{
		--right;
	}
		//left再走,找大
	while(left < right&& a[left] <= a[keyi])
	{
		--left;
	}
	swap(&a[left], &a[right]);
	}
	keyi = left;
	// [begin, keyi-1]keyi[keyi+1, end]
	QuickSort(a, begin, keyi - 1);
	QuickSort(a, keyi + 1, end);
}

那么,我们返回的条件如何判断呢?

我们在实现代码时可以发现,函数体里面是需要两个递归的,而我们需要探究的是递归的终止条件。

递归的终止条件是什么?就需要从传入的参数入手,这里我们将第三趟排序完成之后的两个递归图画出

在这里我们发现,递归的终止条件为begin>=end.

现在我们将代码补全:

cpp 复制代码
void qsort(int* a, int begin, int end)
{
	if (begin >= end)
	{
		return;
	}
	//keyi-->begin处的数据下标
	int keyi = begin;
	int left = begin;
	int right = end;
	while (left < right)
	{
		//right先走,找小
	while(left < right && a[right] >= a[keyi])
	{
		--right;
	}
		//left再走,找大
	while(left < right&& a[left] <= a[keyi])
	{
		--left;
	}
	swap(&a[left], &a[right]);
	}
	keyi = left;
	// [begin, keyi-1]keyi[keyi+1, end]
	QuickSort(a, begin, keyi - 1);
	QuickSort(a, keyi + 1, end);
}

至此,我们便完成了一次快速排序。

三.快排的优化

如果用上述的代码进行排序,假设我们要将一个数组排升序,而原数字是降序的话,那么我们的快速排序的时间复杂度就来到了O(n),这样的消耗是非常大的。

我们发现,这是因为key的值造成的,那么,如果我们可以控制让数组中的哪个数当key,是不是就可以解决问题了呢?

3.1随机数法选key

我们可以在数组下标中随便选一个数来当作我们的keyi,这就需要我们的rand函数。

cpp 复制代码
	int left = begin;
	int right = end;
	int randi = rand() % (right - left + 1);
	randi += left;
	Swap(&a[left], &a[randi]);
	int keyi = left;

这里我们对第三行和第四行代码做出解释

第三行:如果一个数%99,那么它的结果是0-98;如果我们想要其的范围是0-99,则需要+1.

第四行:我们的left并不一定从最左边开始。

3.2三数取中选key

有的人觉得随机选数未免有些风险,就用了三数取中选key法,即找出数组最左边,最右边,以及中间的三个数,然后比较这三个数。谁的值是中位数,谁当key。

cpp 复制代码
int GetMidi(int* a, int left, int right)
{
	int mid = (left + right) / 2;
	if (a[left] > a[right])//如果左大于右
	{
		if (a[right] > a[mid])//左大于右  右大于中  右为中位数
			return right;
		else if (a[mid] > a[left])//中大于左  左大于右  左为中位数
			return left;
		else
			return mid;
	}
	else  //a[right]>a[left]   右大于左
	{
		if (a[left] > a[mid])  左大于中    左为中位数
			return left;
		else if (a[mid] > a[right])  中大于右   右为中位数
			return right;
		else
			return mid;
	}
}

我们将选取k的代码改为下面这几行即可。

cpp 复制代码
	int midi = GetMidi(a, left, right);
	swap(&a[left], &a[midi]);
	int keyi = left;

3.3小区间改造

由于快速排序是使用递归进行排序的,而每次递归都极大的占用空间,但其实我们的递归快到头的时候数组已经快有序了,这时我们再利用递归进行排序则会及大的占用栈的空间。

因此,我们在数组比较小的时候,直接换种排序即可,就譬如用插入排序。

cpp 复制代码
void qsort(int* a, int begin, int end)
{
	if (begin >= end)
	{
		return;
	}
	if (end - begin + 1 < 10)//数组中不足10个元素
	{
		InsertSort(a + begin, end - begin + 1);
	}

	else
	{
		int midi = GetMidi(a, begin, end);
		swap(&a[begin], &a[midi]);
		int keyi = begin;
		int left = begin;
		int right = end;
		while (left < right)
		{
			//right先走,找小
			while (left < right && a[right] >= a[keyi])
			{
				--right;
			}
			//left再走,找大
			while (left < right && a[left] <= a[keyi])
			{
				--left;
			}
			swap(&a[left], &a[right]);
		}
		keyi = left;
		// [begin, keyi-1]keyi[keyi+1, end]
		qsort(a, begin, keyi - 1);
		qsort(a, keyi + 1, end);
	}
}

四.挖坑法

上面的方法有些难理解,于是有人给出了一个理解起来比较容易的快排方法。

现在我们来理解一下这种挖坑法的算法思想。

  • 先将第一个数拿走,形成坑位,将此数定义为key
  • 之后right先走,找小,找到了之后把数放到坑位中,right处形成新的坑
  • left再走,找大,找到后将数放到坑位中,left处形成新的坑位
  • 重复上述动作,直到两者相遇,将key放置在坑位。
cpp 复制代码
void qsort(int* a, int begin, int end)
{
	if (begin >= end)
	{
		return;
	}
	//记录坑位
	int piti = begin;
	//记录坑位的值
	int key = a[begin];
	int left = begin;
	int right = end;
	while (left < right)
	{
		while (left < right && a[right] >= key)
		{
			right--;
		}
		//放坑位,并更新坑位
		a[piti] = a[right];
		piti = right;
		while (left < right && a[left] <= key)
		{
			left++;
		}		
		a[piti] = a[left];
		piti = left;
	}
	a[piti] = key;
	qsort(a, begin, piti - 1);
	qsort(a, piti + 1, end);
}

四.前后指针法

上面的方法效率比较低下,有一位大佬又发明了这么一个方法

这个算法的思路是:

  • 记录第一个位置为key
  • 首先将prev置于第一个位置,cur置于第二个位置
  • 判断cur处的值是否小于key,若小于,则prev先走一步,之后cur再走一步,若++prev!=cur,则将cur指向的内容和prev指向的内容交换,之后cur指针++
  • 一直重复上一个动作,直到cur遇到的值大于key。
  • 遇到的值大于key时,让cur往前走一步,prev不走。
  • 等cur越界时,将prev和key的内容互换
  • 此时key左边的值比key小,右边的值比key大。

这个思路的原理是:通过前后指针法,遇到大的则不让prev走,只让cur走。此时prev和cur中间就差了一个数,而这个数是大于key的,然后让cur再走,直到遇到小于key的值,此时prev和cur都走一步,prev处的值是第一个大于key的值,而此时cur的值是小于key的,让他们交换即可让大于key的值后移,小于key的值前移。而这两个数之间的值都是大于key的,重复上述动作直到cur越界.

cpp 复制代码
void qsort(int* a, int left, int right)
{
	if (left >= right)
		return;
	int keyi = left;
	int prev = left;
	int cur = left + 1;
	while (cur <= right)
	{
		if (a[cur] < a[keyi] && ++prev != cur)
		{
			swap(&a[prev], &a[cur]);
		}
		++cur;
	}
	swap(&a[keyi], &a[prev]);
	qsort(a, left, keyi - 1);
	qsort(a, keyi + 1, right);
}

为什么左边的小,右边的大?//结合代码理解

  • 对于prev指向的元素,它们都比基准元素大或等于基准元素。因为在遍历过程中,如果a[cur]比基准元素小,并且prevcur不相等,则将a[cur]a[prev]进行交换,将prev加1。如果a[cur]比基准元素大或等于基准元素,则不会进行交换操作,prev保持不变。
  • 对于cur指向的元素,它们都比基准元素小或等于基准元素。因为在遍历过程中,如果a[cur]比基准元素大,则不会进行交换操作,cur继续向后遍历。如果a[cur]比基准元素小,则与prev所指向的元素进行交换,并将prev加1。

六.利用栈将递归改非递归

因为函数栈帧是在栈(非数据结构上的栈)上开辟的,所以容易出现栈溢出的情况,为了解决这个问题,还可以将快速排序改为非递归版本,这样空间的开辟就在堆上了,堆上的空间比栈要多上许多。

为了实现快速排序的非递归版本,我们要借助我们以前实现的栈,来模拟非递归。

原理是:

  • 我们通过栈的先进后出的性质,先入一个左边的下标,再入一个右边的下标。
  • 之后我们将它们弹出,并完成单趟排序。然后我们就可以得到了左区间和右区间。
  • 我们先入右区间,再入左区间,以保证我们会先排序左区间再排序右区间。
  • 之后再弹出两个,再排序一次,再入一次两个区间
  • 一直循环这样的操作,一直到区间内没有元素为止。
cpp 复制代码
void QuickSortNonR(int* a, int left, int right)
{
	ST st;
	STInit(&st);
	//先入右,再入左
	STPush(&st, right);
	STPush(&st, left);

	while (!STEmpty(&st))
	{
		//先弹左
		int begin = STTop(&st);
		STPop(&st);
		//再弹右
		int end = STTop(&st);
		STPop(&st);

		// 单趟
		int keyi = begin;
		int prev = begin;
		int cur = begin + 1;

		while (cur <= end)
		{
			if (a[cur] < a[keyi] && ++prev != cur)
				Swap(&a[prev], &a[cur]);

			++cur;
		}

		Swap(&a[keyi], &a[prev]);
		keyi = prev;

		// [begin, keyi-1] keyi [keyi+1, end] 
		//先入右区间
		if (keyi + 1 < end)
		{
			STPush(&st, end);
			STPush(&st, keyi + 1);
		}
		//再入左区间
		if (begin < keyi - 1)
		{
			STPush(&st, keyi - 1);
			STPush(&st, begin);
		}
	}

	STDestroy(&st);
}

我现在来帮助大家画个图进行理解

后语

到此就结束了,下篇博客会更新归并排序的相关内容,希望大家持续关注,可以的话点个免费的赞或者评论关注一下啊!

贴一下专栏: 排序算法专栏 数据结构专栏

相关推荐
小白菜又菜2 小时前
Leetcode 646. Maximum Length of Pair Chain
算法·leetcode·职场和发展
ヾ慈城3 小时前
【数据结构 - 二叉树】
c语言·数据结构·算法·链表
闲仁人3 小时前
数据结构预科
数据结构
卡戎-caryon3 小时前
【项目实践】贪吃蛇
c语言·数据结构·算法
PeterClerk3 小时前
PCA算法降维代码示例
人工智能·算法·机器学习·pca
计算机平台作业答案讲解3 小时前
QT实现GIF动图显示(小白版,可直接copy使用)
服务器·开发语言·数据结构·数据库·c++·qt·动态规划
冲鸭嘟嘟可3 小时前
【数据结构】使用C语言 从零实现一个栈的数据结构
c语言·数据结构·算法
小白菜又菜3 小时前
Leetcode 516. Longest Palindromic Subsequence
算法·leetcode·职场和发展
℡☞小白☜ღ4 小时前
信号量(semaphore)
算法