快速排序是目前比较常用的排序算法,也是需要掌握的排序算法,光听它的名字就知道这种算法的运算速度很快,没错!这是目前已知的算法中平均排序速率最快的。当然这里是说只使用一种排序算法比较的前提下。
快速排序算法主要分为以下几步:
1)选择基准值
2)双指针操作将小于基准的放左边,大于的放右边
3)重复2操作,直至结束
快速排序算法是利用排序轮数不变,每轮排序只比较了log2n次来提高排序速度,这与堆排序,归并排序的原理类似。但是快速排序没有初始建堆的时间和不占用相同大小排序序列空间的优势。
目前快速排序算法主要有三种:左右指针法,挖坑法,前后指针法
下面我先给出递归操作的代码:
javapublic static void quicksort(int[] arrs,int start,int end){ if(start>=end) return; int mid = sort(arrs, start, end); quicksort(arrs, start, mid-1); quicksort(arrs, mid+1, end); }
左右指针法:
大致过程是先以arrs[0]作为基准,然后让j往又从左走,i从左往右走,(注意如果以arrs[0]作为基准,那么就必须让j先执行,具体原因下面说),然后当出现arrs[j]小于基准时,arrs[i]大于基准时,交换arrs[i]和arrs[j]的值,然后继续执行。直到i,j相遇,最后交换arrs[start]与arrs[i]的值即可。
javapublic static int sort1(int[] arrs,int start,int end){ int i=start,j=end; int tmp = arrs[i]; while(i<j){ while (arrs[j] >= tmp && i<j) j--; while (arrs[i] <= tmp && i<j) i++; swap(arrs[i], arrs[j]); } swap(arrs[i], arrs[start]); return i; }
这种方式也是我们最常见的方式,但是这种方式在测试的时候一不小心就会出现上面的错误,现在我们就说一下出错的原因:
eq:2, 6, 9, 3, 0, 1 -->2, 1, 9, 3, 0, 6-->2, 1, 0, 3, 9, 6 ------------->3, 1, 0, 2, 9, 6
例如上面的一组数,首先以2为基准,第一次循环i指向6,j指向1,i,j交换,到第二列数;
然后进行第二次循环i指向9,j指向0,i,j交换,到第三列数;
此时如果让i先走,i遇到3停止,接着j走,但是i,j相遇,不能继续执行,i,j交换后退出循环,此时交换arrs[start]和arrs[i];到第四列数;
这时就会发现一轮交换下来的数出现了错误,而让j先走的话就不会出现这样的错误,读者可以按照上面的数和代码自己分析。
挖坑法:
大致过程也是先以arrs[0]作为基准并赋给一个临时变量tmp,然后让j往又从左走,i从左往右走,(这种方式也需要j先走),然后当出现arrs[j]小于基准时,将arrs[j]赋值给arrs[i],然后当arrs[i]大于基准,将arrs[i]赋值给arrs[j],继续执行。直到i,j相遇,最后将tmp赋值给arrs[i];
javapublic static int sort2(int[] arrs,int start,int end){ int i=start,j=end; int tmp = arrs[i]; while(i<j){ while (arrs[j] >= tmp && i<j) j--; arrs[i]=arrs[j]; while (arrs[i] <= tmp && i<j) i++; arrs[j]=arrs[i]; } arrs[i]=tmp; return i; }
这种方式和它的名字相同,先将arrs[0]的值挖出来赋给tmp,这时只有arrs[0]一个坑,所以也需要j先走,当j退出内循环时,挖出arrs[j]的值赋给arrs[i],此时arrs[j]里面的值就会变成一个废值,接着继续执行,最后再将tmp的值赋给最后一个废坑中。
前后指针法:
大致过程也是先以arrs[0]作为基准并赋给一个临时变量tmp,利用两个指针怕q,p分别指向下一个位置和当前位置,当小于基准时,p跟在q的后面,如果出现大于基准时,q向后移动,p不动,然后当再次出现小于基准的值时且p没有跟在q的后面,p,q位置上的值交换,继续执行,最后将p指向的值与start位置上的值互换。
javapublic static int sort3(int[] arrs,int start,int end){ int p=start,q = start+1; int tmp = arrs[p]; while(q<=end) { while(tmp>=arrs[q] && ++p!=q) swap(arrs[p], arrs[q]); q++; } arrs[start] = arrs[p]; arrs[p] = tmp; return p; }
这是这三种快速排序算法设计思路最奇特的方法,而且这种方法还可以用于链表的排序,个人还是比较欣赏这种算法的设计者,而且这种思路的代码设计也比较巧妙。
以上三种都是快速排序的实现方式,三种方法虽然想法上不太一致。但都达到了快速排序的要求。
缺陷:快速排序也有自身的缺点,因为快速排序对于基准值的要求比较高,如果基准值选择不当,就会导致排序效率严重降低。
eq 1,2,3,4,5,6,7,8
比如上面的这个序列如果使用快速排序并以第一个数为基准值,则排序的时间复杂度则为(n*n),而且快速排序还是一种不稳定的排序。但是这并不能掩盖它的优势,它依旧比较火的排序。
当然,网上对于基准值的选择也有一些优化的手段,具体的方法可以参考下面参照链接。
后续:很遗憾java8中的Collections.sort()方法并没有使用快速排序算法,可能是因为快速排序对于基准值难以把握。那就有点奇怪了,快速排序算法明明号称是速度第一的排序算法,为什么java8不用它,难道编写java8的人不知道吗?当然不是,值得一提的是java8中的sort方法并没有单独的利用某一个排序算法,而是充分利用了八大排序算法的优势,当排序序列小于32时使用折半查找的直接插入算法,当大于32时使用归并排序算法分割序列,序列小于32时依旧使用折半查找的直接插入算法,不过其中还有很多很多的优化策略,例如当一对序列进行归并时,归并算法需要重新分配与之长度相同的一段数组空间,很是浪费空间,但是java8先计算出不需要排序的子序列,然后只new出较短序列长度相同的数组存储临时值,与普通的归并算法比较,可以节省至少一半的空间。再其次是较短序列排序时,使用直插排序更好,所以当分隔到32长度时,选择使用直插算法。然而排序直接插入算法的时间复杂度为(nn),而java8利用折半查找的方式让每一轮比较只进行log2N次,这样总的排序效率可以达到(nlog2N)的效果,而且任何序列都可以保证等等。总的来说,每一种排序算法都有其优势和劣势,但是如果能够充分利用各个排序算法的优势,就能够达到最佳的效果。