文章目录
注:内容参考王道2024考研复习指导以及《数据结构》
排序的基本概念
排序(sort),就是重新排列表中的元素,使表中的元素满足按关键字有序的过程。
排序算法的评价指标
- 时间复杂度
- 空间复杂度
- 稳定性
算法的稳定性,若待排序表中有两个元素Ri和Rj,其对应的关键字相同即keyi = keyj,且在排序前Ri在Rj的前⾯,若使⽤某⼀排序算法排序后,Ri仍然在Rj的前⾯,则称这个排序算法是稳定的,否则称排序算法是不稳定的。
排序算法的分类
- 内部排序------数据都在内存中,关注如何使算法的时、空间复杂度更低
- 外部排序------数据太多,无法全部放入内存,还要关注如何使读/写磁盘次数更少
注 :进行基于比较的排序,至少要进行 ⌈ log 2 ( n ! ) ⌉ \lceil \log _2 (n!) \rceil ⌈log2(n!)⌉次比较。
解释:n个数组成的不同排列方式有n!个。已经排好序的数列(假设是从小到大排列)是这n!个序列中的一个,排序所作的就是找出这个序列。
设这数列中有两个数 a ,b。这n!种排列组合中a在b前和a在b后的机会是均等的。
比较一次a,b的大小(不妨假设a<b),那么所有 a排在b后的情况都是不符合从小到大的要求的。这样我们将n!个可能的情况剔除了一半。
重复以上步骤,理想状态下,每比较一次都可以排除一半的情况。
插入排序
直接插入排序
算法思想
每次将一个待排序的记录按其关键字大小插入到前面已经排好序的子序列中,直到全部记录插入完成。
算法实现(无哨兵)
c
//直接插入排序
void InsertSort(int A[],int n){
int i,j,temp;
for(i=1;i<n;i++){//从第二个元素开始,进行排序
if(A[i]<A[i-1]){//如果当前元素比前驱元素小,进行插入操作
temp=A[i];
for(j=i-1;j>=0 && A[j]>temp;j--){//从当前元素前驱元素开始,向前寻找,知道找到不大于当前元素的值,停止
A[j+1]=A[j];//每往前寻找一个,进行交换
}
A[j+1]=temp;//插入找到的位置
}
}
}
算法效率分析
空间复杂度:O(1)
时间复杂度:主要来自对比关键、移动元素,若有n个元素,则需要对比n-1趟处理。则最好时间复杂度(全部有序): O ( n ) O(n) O(n);最坏时间复杂度(全部逆序): O ( n 2 ) O(n^2) O(n2);平均时间复杂度: O ( n 2 ) O(n^2) O(n2)
算法稳定性:稳定
适用性:直接插入排序适用于顺序存储和链式存储的线性表,采用链式存储时无需移动元素。
对链表进行插入排序
移动元素的次数变少了,但是关键字对比的次数依然是 O ( n 2 ) O(n^2) O(n2)数量级,整体来看时间复杂度依然是 O ( n 2 ) O(n^2) O(n2)
折半插入排序
思路:先用折半查找找到应该插入的位置,再移动元素。
c
void InsertSort(int A[],int n){
int i,j,low,mid,high;
for(i=2;i<=n;i++){//A[0]位置作为哨兵,A[1]位置不需要排序
A[0]=A[i];
low=1;high=i-1;
while(low<=high){
mid=(low+high)/2;
if(mid>A[0]){
high=mid-1;
}else{
low=mid+1;
}
}
for(j=i-1;j>=high+1;j--){
A[j+1]=A[j];
}
A[high+1]=A[0];
}
}
当 low>high 时折半查找停⽌,应将 [low, i-1] 内的元素全部右移,并将 A[0] 复制到 low 所指位置。
当 A[mid]==A[0] 时,为了保证算法的"稳定性",应继续在 mid 所指位置右边寻找插⼊位置。
性能分析
折半插入排序每趟的比较次数都为 O ( l o g 2 m ) O(log_2m) O(log2m),m为当前已经排好序的子序列的长度。
比起"直接插⼊排序",⽐较关键字的次数减少了,但是移动元素的次数没变,整体来看时间复杂度依然是 O ( n 2 ) O(n^2) O(n2)。
折半插入排序仅适用于顺序存储的线性表。
希尔排序
希尔排序,先将待排序表分割成若干形如 L [ i , i + d , i + 2 d , . . . , i + k d ] L[i,i+d,i+2d,...,i+kd] L[i,i+d,i+2d,...,i+kd]的特殊子表,对各个子表分别进行直接插入排序。缩小增量d,重复上述过程,直到d=1为止。
算法实现
c
void ShellSort(int A[],int n){
int d,i,j;
for(d=n/2;d>=1;d=d/2){
for(i=d+1;i<=n;i++){//A[0]是暂存单元,不是哨兵
if(A[i]<A[i-d]){
A[0]=A[i];
for(j=i-d;j>0 && A[0]<A[j];j-=d){
A[j+d]=A[j];
}
A[j+d]=A[0];
}
}
}
}
算法性能分析
空间复杂度:O(1)
时间复杂度:和增量序列 d 1 , d 2 , d 3 , . . . d_1,d_2,d_3,... d1,d2,d3,...d的选择有关,最坏时间复杂度为 O ( n 2 ) O(n^2) O(n2),当n在某个范围内时,可 O ( n 1.3 ) O(n^{1.3}) O(n1.3)
稳定性:不稳定
适用性:仅适用于顺序存储的线性表,不适用于链表
交换排序
基于"交换"的排序:根据序列中两个元素关键字的⽐较结果来对换这两个记录在序列中的位置。
冒泡排序
从后往前(或从前往后)两两比较相邻元素的值,若为逆序(即 A [ i − 1 ] > A [ i ] A[i-1] > A[i] A[i−1]>A[i]),则交换它们,直到序列比较完,称这样过程为"一趟"冒泡排序。
每一趟都会确定一个最小(或最大)的元素的位置。
算法实现
c
void swap(int &a,int &b){
int temp=a;
a=b;
b=temp;
}
void BubbleSort(int A[],int n){
for(int i=0;i<n-1;i++){
bool flag=false;
for(int j=n-1;j>i;j--){
if(A[j-1]>A[j]){//此时算法稳定
swap(A[j-1],A[j]);
flag=true;
}
}
if(flag==false) return ;
}
}
算法性能分析
空间复杂度:O(1)
时间复杂度:最好情况(有序)为 O ( n ) O(n) O(n);最坏情况(逆序)为 O ( n 2 ) O(n^2) O(n2);平均时间复杂度为 O ( n 2 ) O(n^2) O(n2)
适用性:冒泡排序适用于顺序存储的线性表和链式存储的线性表。
注:冒泡排序中所产生的有序子序列一定是全局有序的;每趟排序都会将一个元素放置到其最终的位置上。
快速排序
在待排序表L[1...n]中任取⼀个元素pivot作为枢轴(或基准,通常取⾸元素)。
通过⼀趟排序将待排序表划分为独⽴的两部分L[1...k-1]和L[k+1...n],使得L[1...k-1]中的所有元素⼩于pivot,L[k+1...n]中的所有元素⼤于等于pivot,则pivot放在了其最终位置L(k)上,这个过程称为⼀次"划分"。
然后分别递归地对两个⼦表重复上述过程,直⾄每部分内只有⼀个元素或空为⽌,即所有元素放在了其最终位置上。
算法实现
c
int Partition(int A[],int low,int high){
int pivot=A[low];
while(low<high){
while(low<high && A[high]>=pivot) high--;
A[low]=A[high];
while(low<high && A[low]<=pivot) low++;
}
A[low]=pivot;
return low;
}
void QuickSort(int A[],int low,int high){
if(low<high){
int pivotpos=Parition(A,low,high);
QuickSort(A,low,pivotpos-1);
QuickSort(A,pivotpos+1,high);
}
}
算法性能分析
时间复杂度:O(n*递归层数),每一层的QuickSort只需要处理剩余的待排序元素,时间复杂度不超过O(n)
空间复杂度:O(递归层数)
把n个元素组织成二叉树,二叉树的层数就是递归调用的层数,n个结点的二叉树最小高度= ⌊ log 2 n ⌋ + 1 \lfloor \log_2n \rfloor+1 ⌊log2n⌋+1,最大高度=n。
所以,时间复杂度: O 最好 = ( n log 2 n ) , O 最坏 = O ( n 2 ) , O 平均 = ( n log 2 n ) O_{最好}=(n\log_2n),O_{最坏}=O(n^2),O_{平均}=(n\log_2n) O最好=(nlog2n),O最坏=O(n2),O平均=(nlog2n)
空间复杂度: O 最好 = ( log 2 n ) , O 最坏 = O ( n ) O_{最好}=(\log_2n),O_{最坏}=O(n) O最好=(log2n),O最坏=O(n)
稳定性:不稳定
适用性:快速排序仅适用于顺序存储的线性表。
注:408原题中说,对所有尚未确定最终位置的所有元素进⾏⼀遍处理称为"⼀趟"排序,因此⼀次"划分"≠⼀趟排序。⼀次划分可以确定⼀个元素的最终位置,⽽⼀趟排序也许可以确定多个元素的最终位置。上图一层QuickSort对应一趟排序。
选择排序
选择排序:每⼀趟在待排序元素中选取关键字最⼩(或最⼤)的元素加⼊有序⼦序列。
简单选择排序
每次从未排序的记录中选择最小的关键字,将其放到排好序的记录尾部。
算法实现
c
void SelectSort(int A[],int n){
for(int i=0;i<n-1;i++){
int min=i;
for(int j=i+1;j<n;j++){
if(A[j]<A[min]){
min=j;
}
}
if(min!=i){
swap(A[i],A[min]);
}
}
}
算法性能分析
时间复杂度 = O ( n 2 ) =O(n^2) =O(n2)
空间复杂度 = O ( 1 ) =O(1) =O(1)
稳定性:不稳定
适用性:简单选择排序适用于顺序存储和链式存储的线性表,以及关键字较少的情况。
堆排序
堆
若n个关键字序列L[1...n] 满⾜下⾯某⼀条性质,则称为堆(Heap):
- 若满足:L(i)≥L(2i)且L(i)≥L(2i+1) (1 ≤ i ≤n/2 )------ 大根堆(大顶堆),即二叉树的左、右结点都不大于根结点
- 若满足:L(i)≤L(2i)且L(i)≤L(2i+1) (1 ≤ i ≤n/2 )------ 小根堆(小顶堆),即二叉树的左、右结点都不小于根结点
基于"堆"进行排序
- 先建立大顶堆
思路:把所有非终端结点都检查⼀遍,是否满足大根堆的要求,如果不满足,则进行调整。
-
在顺序存储的完全⼆叉树中,非终端结点编号 i≤⌊n/2⌋
-
检查当前结点是否满足根≥左、右,若不满足,将当前结点与更大的⼀个孩⼦互换。
-
若元素互换破坏了下⼀级的堆,则采用相同的方法继续往下调整(小元素不断"下坠")。
代码实现
c
//建立大顶堆
void BuildMaxHeap(int A[],int len){
for(int i=len/2;i>0;i--){
HeadAdjust(A,i,len);
}
}
void HeadAdjust(int A[],int k,int len){
A[0]=A[k];
for(int i=2*k;i<=len;i*=2){
if(i<len && A[i]<A[i+1]){
i++;
}
if(A[0]>=A[i]) break;
else{
A[k]=A[i];
k=i;
}
}
A[k]=A[0];
}
- 基于大顶堆进行排序
每一趟将堆顶元素加入有序子序列,与待排序序列中的最后一个元素交换。
并将待排序元素序列再次调整为⼤根堆(小元素不断"下坠")。
堆排序的完整逻辑
c
void HeapSort(int A[],int len){
BuildMaxHeap(A,len);
for(int i=len;i>1;i--){
swap(A[i],A[1]);
HeadAjust(A,1,i-1);
}
}
算法效率分析
⼀个结点,每"下坠"⼀层,最多只需对对关键字2次,若树高为h,某结点在第 i 层,则将这个结点向下调整最多只需要"下坠" h-i 层,关键字对⽐次数不超过 2(h-i),n个结点的完全二叉树树高 h = ⌊ log 2 n ⌋ + 1 h=\lfloor \log_2n \rfloor+1 h=⌊log2n⌋+1,第 i 层最多有 2i−1 个结点,而只有第 1 ~ (h-1) 层的结点才有可能需要"下坠"调整,将整棵树调整为⼤根堆,关键字对⽐次数不超过 ∑ i = h − 1 1 2 i − 1 2 ( h − i ) < = 4 n \sum^1_{i=h-1}2^{i-1}2(h-i) <=4n ∑i=h−112i−12(h−i)<=4n,则建堆的过程,关键字对比次数不超过4n,建堆时间复杂度 O ( n ) O(n) O(n)
根节点最多"下坠" h-1 层,每下坠⼀层,⽽每"下坠"⼀层,最多只需对⽐关键字2次,因此每⼀趟排序复杂度不超过 O(h) = O(log2n),共n-1 趟,总的时间复杂度 = O ( n log 2 n ) =O(n\log_2 n) =O(nlog2n)
综上,时间复杂度 = O ( n log 2 n ) =O(n\log_2n) =O(nlog2n),空间复杂度 = O ( 1 ) =O(1) =O(1)
稳定性:不稳定
适用性:堆排序仅适用于顺序存储的线性表
堆排序的插入与删除
- 在堆中插入新元素
对于小根堆,新元素放到表尾,与父节点对比,若新元素比父节点更小,则将二者互换。新元素就这样一路"上升",直到无法继续上升为止。
- 在堆中删除元素
被删除的元素用堆底元素替代,然后让元素不断"下坠",直到⽆法下坠为止。
注:堆是用于排序的,在查找时它是无序的,查找效率没有其他查找结构高。
归并排序和基数排序
归并排序
归并(merge):把两个或多个已经有序得到序列合并成一个。
"2路"归并:把两个有序序列合并成一个,每次选出一个小元素需要对比关键字1次。
"4路"归并:把四个有序序列合并成一个,每次选出一个小元素需要对比关键字3次。
结论:m路归并,每选出⼀个元素需要对比关键字 m-1 次。
代码实现
c
int *B=(int *)malloc(n*sizeof(int));//辅助数组
void Merge(int A[],int low,int mid,int high){
int i,j,k;
for(k=mid;k<=high;k++){
B[k]=A[k];//复制到辅助数组B
}
for(i=low,j=mid+1,k=i;i<=mid && j<=high;k++){
if(B[i]<=B[j]){//确保稳定性
A[k]=B[i++];
}else{
A[k]=B[j++];
}
}
while(i<=mid) A[k++]=B[i++];
while(j<=high) A[k++]=B[j++];
}
void MergeSort(int A[],int low,int high){
if(low<high){
int mid=(low+high)/2;
MergeSort(A,low,mid);
MergeSort(A,mid+1,high);
Merge(A,low,mid,high)
}
}
算法效率分析
2路归并的归并树------形态上就是一棵倒立的二叉树,二叉树的第h层最多有 2 h − 1 2^{h-1} 2h−1个结点,若树高为h,则应满足 n ≤ 2 h − 1 n \leq 2^{h-1} n≤2h−1,即 h − 1 = ⌈ log 2 n ⌉ h-1=\lceil \log_2n \rceil h−1=⌈log2n⌉
时间复杂度:n个元素进行2路归并,归并趟数 = ⌈ log 2 n ⌉ =\lceil \log_2n \rceil =⌈log2n⌉,每趟归并时间复杂度为 O ( n ) O(n) O(n),则算法时间复杂度为 O ( n log 2 n ) O(n\log_2n) O(nlog2n)
空间复杂度:空间复杂度为 O ( n ) O(n) O(n),来自辅助数组B
稳定性:稳定
适用性:归并排序适用于顺序存储和链式存储的线性表
基数排序
假设⻓度为n的线性表中每个结点 a j a_j aj的关键字由d元组( k j d − 1 , k j d − 2 , k j d − 3 , . . . , k j 1 , k j 0 k^{d-1}_j,k^{d-2}_j,k^{d-3}_j,...,k^1_j,k^0_j kjd−1,kjd−2,kjd−3,...,kj1,kj0) 组成,其中, 0 ≤ k j i ≤ r − 1 ( 0 ≤ j < n , 0 ≤ i ≤ d − 1 ) 0 \leq k^i_j \leq r-1(0 \leq j < n,0 \leq i \leq d-1) 0≤kji≤r−1(0≤j<n,0≤i≤d−1),r称为"基数"。
在上述示例中,每个结点都是由三元组组成(个位、十位、百位),每个位置的值都不超过9=10-1,所以,10称为该线性表的基数。
基数排序得到递增序列的过程
基数排序(Radix Sort)不基于比较和移动进行排序,而基于关键字各位的大小进行排序。
- 初始化: 设置 r 个空队列, Q 0 , Q 1 , . . . , Q r − 1 Q_0,Q_1,...,Q_{r-1} Q0,Q1,...,Qr−1
- 按照各个关键字位权重递增的次序(个、十、百),对 d 个关键字位分别做"分配"和"收集"
- 分配:顺序扫描各个元素,若当前处理的关键字位=x,则将元素插⼊ Qx 队尾
- 收集:把 Q 0 , Q 1 , . . . , Q r − 1 Q_0,Q_1,...,Q_{r-1} Q0,Q1,...,Qr−1各个队列中的结点依次出队并链接
代码实现
基数排序通常基于链式存储实现。
c
typedef struct LinkNode{
ElemType data;
struct LinkNode *next;
}LinkNode,*LinkList;
typedef struct{
LinkNode *front,*rear
}LinkQueue;
算法效率分析
空间效率:一趟排序需要的辅助存储空间为r(r个队列:r个队头指针和r个队尾指针),但以后的排序中会重复使用这些队列,所以基数排序的空间复杂度为 O ( r ) O(r) O(r)。
时间效率:基数排序需要进行d趟"分配"和"收集"操作。一趟分配需要遍历所有关键字,时间复杂度为 O ( n ) O(n) O(n);一趟收集需要合并r个队列,时间复杂度为 O ( r ) O(r) O(r)。因此基数排序的时间复杂度为 O ( d ( n + r ) ) O(d(n+r)) O(d(n+r)),它与序列的初始状态无关。
稳定性:稳定
适用性:基数排序适用于顺序存储和链式存储的线性表。
基数排序擅长解决的问题:
- 数据元素的关键字可以⽅便地拆分为 d 组,且 d 较小
- 每组关键字的取值范围不⼤,即 r 较小
- 数据元素个数 n 较大
计数排序
计数排序也是一种不基于比较的排序算法。
计数排序思想
对每个待排序的元素x,统计小于x的元素个数,利用该信息就可以确定x的最终位置(当有多个元素相同时,该方案还需进行一定的优化)。
代码实现
在计数排序算法的实现中,假设输入是一个数组A[n],序列长度为n,我们还需要两个数组:B[n]存放输出的排序序列,C[k]存储计数值。用输入数组A中的元素作为数组c的下标(索引),而该元素出现的次数存储在该元素作为下标的数组C中。
c
void CountSort(ELemType A[],ElemType B[],int n,int k){
int i,C[k];
for(i=0;i<k;i++){
C[i]=0;
}
for(i=0;i<n;i++){
C[A[i]]++;
}
for(i=1;i<k;i++){
C[i]=C[i]+C[i+1];
}
for(i=n-1;i>=0;i--){
B[C[A[i]]-1]=A[i];
C[A[i]]=C[A[i]]-1;
}
}
性能分析:
空间效率:计数排序是一种用空间换时间的做法。输出数组的长度为n;辅助的计数数组的长度为k,空间复杂度为 O ( n + k ) O(n+k) O(n+k)。若不把输出数组视为辅助空间,则空间复杂度为 O ( n ) O(n) O(n)。
时间效率:上述代码的第1个和第3个for循环所花的时间为 O ( k ) O(k) O(k),第2个和第4个for循环所花的时间为 O ( n ) O(n) O(n),总时间复杂度为 O ( n + k ) O(n+k) O(n+k)。因此,当 k = O ( n ) k=O(n) k=O(n)时,计数排序的时间复杂度为 O ( n ) O(n) O(n);但当 k > O ( n log n ) k > O(n\log n) k>O(nlogn)时,其效率反而不如一些基于比较的排序(如快速排序、堆排序等)。
稳定性:稳定。
适用性:计数排序更适用于顺序存储的线性表。计数排序适用于序列中的元素是整数且元素范围(0~k-1)不能太大,否则会造成辅助空间的浪费。
内部排序的比较
因素 | |
---|---|
时间复杂度 | 1. 简单选择排序、直接插入排序和冒泡排序在平均情况下时间复杂度都为 O ( n 2 ) O(n^2) O(n2),但直接插入排序和冒泡排序时间复杂度最好可以达到 O ( n ) O(n) O(n),而简单排序与序列初始状态无关。 2. 希尔排序作为插入排序的扩展,目前未得出精确的渐进时间。 3. 堆排序,利用堆结构,可以在线性时间内完成建堆,在 O ( n log 2 n ) O(n \log_2 n) O(nlog2n)内完成排序。 4. 快速排序基于分治思想,最坏时间复杂度会达到 O ( n 2 ) O(n^2) O(n2),但平均性能可以达到 O ( n log 2 n ) O(n \log_2 n) O(nlog2n)。 5. 归并排序基于分治思想,但其分割子序列与初始序列的排列无关,最好、最坏和平均时间复杂度均为 O ( n log 2 n ) O(n \log_2 n) O(nlog2n)。 |
空间复杂度 | 1. 简单选择排序、插入排序、冒泡排序、希尔排序和堆排序都仅需借助常数个辅助空间。 2. 快速排序需要借助一个递归工作栈,平均大小为 O ( log 2 n ) O(\log_2 n) O(log2n),在最坏情况下可能会增长到 O ( n ) O(n) O(n)。 3. 二路归并排序在合并操作中需要借助较多的辅助空间用于元素复制,大小为 O ( n ) O(n) O(n)。 |
稳定性 | 1. 插入排序、冒泡排序、归并排序和基数排序是稳定的排序算法。 2. 简单选择排序、快速排序、希尔排序和堆排序都是不稳定的排序算法。 3. 平均时间复杂度为 O ( n log 2 n ) O(n \log_2 n) O(nlog2n)的稳定排序算法只有归并排序。 |
适用性 | 1. 折半插入排序、希尔排序、快速排序和堆排序适用于顺序存储。 2. 直接插入排序、冒泡排序、简单选择排序、归并排序和基数排序既适用顺序存储,又适用链式存储。 |
外部排序
外部排序
外存、内存之间的数据交换
磁盘的读/写以"块"为单位,数据读⼊内存后才能被修改,修改完了还要写回磁盘。
外部排序的原理
使⽤"归并排序"的⽅法,最少只需在内存中分配3块⼤⼩的缓冲区,即可对任意⼀个⼤⽂件进⾏排序。
- 构造初始归并段
"归并排序"要求各个⼦序列有序,每次读⼊两个块的内容,进⾏内部排序后写回磁盘。得到一个大小2块的有序归并段。构造初始归并段,需要16次"读"和16次"写"。
- 第一趟归并
把8个有序⼦序列(初始归并段)两两归并,将两个有序归并段归并为⼀个,若缓冲区1 空了就要⽴即⽤归并段1 的下⼀块补上;缓冲区2 空了就要⽴即⽤归并段2 的下⼀块补上。结果可以归并称更长的有序序列。
- 第⼆趟归并
把4个有序⼦序列(归并段)两两归并,将两个有序归并段归并为一个。
- 第三趟归并
把2个有序⼦序列(归并段)归并为一个。
时间开销分析
读、写磁盘次数= 32(文件总块数*2)+32*3(归并趟数) = 128 次
注:磁盘是慢速设备,读写次数太多导致时间开销⼤幅增加
外部排序时间开销=读写外存的时间+内部排序所需时间+内部归并所需时间
多路平衡归并与败者树
多路平衡归并
多路归并
内存中设置更多个输出缓冲区,将4个有序归并段归并为一个
采用4路归并,只需要进行两趟归并即可,读、写磁盘次数= 32+32*2 = 96 次。
重要结论:采⽤多路归并可以减少归并趟数,从⽽减少磁盘I/O(读写)次数。
对 r 个初始归并段,做k路归并,则归并树可⽤ k 叉树表示,若树⾼为h,则归并趟数 = h-1 = ⌈logkr⌉
推导,k叉树第h层最多有 k h − 1 k^{h-1} kh−1个结点,则 r ≤ k h − 1 , ( h − 1 ) 最小 = ⌈ log k r ⌉ r \leq k^{h-1},(h-1)_{最小}=\lceil \log_kr \rceil r≤kh−1,(h−1)最小=⌈logkr⌉
多路归并带来的负⾯影响:
- k路归并时,需要开辟k个输⼊缓冲区,内存开销增加。
- 每挑选⼀个关键字需要对⽐关键字(k-1)次,内部归并所需时间增加。
减少初始归并段的数量
⽣成初始归并段的"内存⼯作区"越⼤,初始归并段越⻓。
对 r 个初始归并段,做k路归并,则归并树可用k 叉树表示,若树高为h,则归并趟数 = h-1 = ⌈logkr⌉。
k越⼤,r越小,归并趟数越少,读写磁盘次数越少。若能增加初始归并段的长度,则可减少初始归并段数量 r。
注:若共 N 个记录,内存⼯作区可以容纳 L 个记录,则初始归并段数量 r = ⌈N/L⌉
多路平衡归并
k路平衡归并
- 最多只能有k个段归并为⼀个;
- 每⼀趟归并中,若有 m 个归并段参与归并,则经过这⼀趟处理得到⌈m/k⌉个新的归并段。
败者树
使用多路平衡归并策略,选出一个最小的元素需要对比关键字(k-1)次,导致内部归并所需时间增加。
为此使用"败者树"进行优化。
败者树的构造
对于叶子结点,两两进行对比,失败者留在这⼀回合,胜利者进⼊下⼀回合比。
败者树,可视为⼀棵完全⼆叉树(在根结点之上还有一个结点)。k个叶结点分别是当前参加比较的元素,非叶子结点用来记忆左右子树中的"失败者",而让胜者往上继续进行比较,⼀直到根结点。
败者树在多路平衡归并中的应用
每个叶⼦结点对应⼀个归并段,分支结点记录失败者来自哪个归并段,根结点(蓝色结点)记录冠军来自哪个归并段。
-败者树的实现思路
k路归并的败者树只需要定义⼀个⻓度为 k 的数组即可
因为叶子结点是虚拟的,只需要记录分支节点,同时is[0]记录蓝色根结点。
对于 k 路归并,第⼀次构造败者树需要对⽐关键字 k-1 次
有了败者树,选出最⼩元素,只需对⽐关键字 ⌈ log 2 k ⌉ \lceil \log_2 k \rceil ⌈log2k⌉次
置换选择排序
设初始待排⽂件为FI,初始归并段输出⽂件为FO,内存⼯作区为WA,FO和WA的初始状态为空,WA可容纳w个记录。
置换-选择算法的步骤如下:
- 从FI输⼊w个记录到⼯作区WA。
- 从WA中选出其中关键字取最小值的记录,记为MINIMAX记录。
- 将MINIMAX记录输出到FO中去。
- 若FI不空,则从FI输⼊下⼀个记录到WA中。
- 从WA中所有关键字比MINIMAX记录的关键字⼤的记录中选出最小关键字记录,作为新的MINIMAX记录。
- 重复3~5,直至在WA中选不出新的MINIMAX记录为⽌,由此得到⼀个初始归并段,出⼀个归并段的结束标志到FO中去。
- 重复2~6,直至WA为空。由此得到全部初始归并段
最佳归并树
归并树的神秘性质
每个初始归并段看作⼀个叶⼦结点,归并段的⻓度作为结点权值,则归并树的带权路径⻓度 WPL = 2*1 + (5+1+6+2) * 3 = 44= 读磁盘的次数 = 写磁盘的次数
重要结论:归并过程中的磁盘I/O次数 = 归并树的WPL * 2
构造2路归并的最佳归并树
最佳归并树 WPLmin = (1+2)*4 + 2*3+5*2 + 6*1= 34
读磁盘次数=写磁盘次数=34次;总的磁盘I/O次数 = 68
多路归并的最佳归并树
WPLmin = (2+3+6)*3 + (9+12+17+24+18)*2 + 30*1= 223
归并过程中磁盘I/O总次数=446次
注意:对于k叉归并,若初始归并段的数量⽆法构成严格的 k 叉归并树,则需要补充⼏个⻓度为 0 的"虚段",再进⾏ k 叉哈夫曼树的构造。
添加虚段的数量
- 若(初始归并段数量 -1)% (k-1)= 0,说明刚好可以构成严格k叉树,此时不需要添加虚段
- 若(初始归并段数量 -1)% (k-1)= u ≠ 0,则需要补充 (k-1) - u 个虚段