问题描述
给定线性序列中n个元素和一个整数k,1≤k≤n,要求在线性时间中找出这n个元素中第k小的元素
常规思路
常规思路是对序列先排序,落在第k个位置的元素就是第k小的元素。
这种方法的时间复杂度不是线性的,是O(nlogn)的时间复杂度,使用快排极端情况下甚至会出现O(n^2)的时间复杂度。问题需要在O(n)的时间内完成,故而这种方法不可行
快速排序的时间复杂度可以看这篇文章的最后
分治法解决

使用分治法解决这个问题,思路就是先将数组一分为二,利用Partition
函数,将数组分成左小右大的两部分,然后判断Partition
函数返回的中枢i
与k
的关系
i<k
,第k小在右数组,递归调用自身,在i+1
到r
的区间中找第k-j
小i>k
,第k小在左数组,递归调用自身,在p
到i
的区间中找第k小i==k
,当前值就是第k小
递归边界是p=r
时,数组只有一个元素,第一小第k小都是该元素
代码
c
Type RandomizedSelect(Type a[], int p, int r, int k) {
if (p == r)
return a[p];
i = RandomizedPartition(a, p, r);
j = i - p + 1;
if (k == j)
return a[i];
else if (k < j)
return RandomizedSelect(a, p, i, k);
else
return RandomizedSelect(a, i + 1, r, k - j);
}
c
Type RandomizedPartition(Type a[], int p, int r) {
i = Random(p, r);//用于生成p到r的随机数
swap(a[i], a[p]);//交换a[i]和a[p]
return Partition(a, p, r);
}
关于Partition
算法,可以看这篇文章中的介绍
由于Partition
算法存在的不足,故而这里使用RandomizedPartition
算法,随机选择一个元素作为划分基准,效果更好
算法分析
极端情况下,算法的最坏时间复杂度 仍是 O ( n 2 ) O(n^2) O(n2),尽管使用RandomizedPartition
算法,仍不难保证极端情况的绝对不发生
但可以证明,算法的平均时间复杂度 是 O ( n ) O(n) O(n)的
分治策略相关问题
循环赛日程表问题
快速排序中的分治策略
棋盘覆盖问题
快速幂算法