几种经典排序算法

插入排序
- 折半插入排序法
选择排序
冒泡排序
希尔排序
堆排序
二路归并排序
快速排序

在介绍排序之前，先来说说，研究不同的排序主要是要研究他们的哪些不同：

时间性能。即排序过程中元素之间的比较次数与元素移动次数。我们此次讨论各种排序方法的时间复杂度时，主要按照最差情况下所需要的比较次数来进行。
空间性能。除了存放参加排序的元素之外，排序过程中所需要的其他辅助空间。
排序稳定性。对于值相同的两个元素，排序前后的先后次序不变，则称这种排序方法稳定，否则称其不稳定。

然后还有一个概念我们后面会经常提到：趟。排序需要若干遍循环完成，每循环一遍，就叫一趟。

然后，我们今天的例子中，都是以从小到大排序为例的。

另外，因为排序免不了需要交换位置，因此我们先写好一个Swap函数用于交换：

void Swap(int* pa,int* pb)

{

int tmp=*pa;

*pa=*pb;

*pb=tmp;

}

插入排序

动画演示 ：

核心思想：

在第i趟排序中，将序列的第i+1个元素，按照值大小，插入到前i个已排好序的序列中。

静态演示：

将【49,38,97,76,65,13,27,50】进行插入排序：

其中红色部分表示已经排好序的部分，花圈元素表示下一趟 要排序的元素。
可以看出来，n个元素，需要n-1趟插入排序才能完全排好。

算法：

我们先写一趟排序的算法，然后再加循环。加循环无外就是判断一下起始和结束条件。

c 复制代码

void insertSort(int k[],int n)//传入要进行排序的数组以及元素数
{
    int i,j;//i表示第i趟，也表示当前要调整的元素的下标
    //j用来遍历已排好序的序列，用于和第i个元素比较
    int tmp=k[i];
    for(i=1;i<n;i++)
    {
        for(j=i-1;j>=0&&k[j]>tmp;j--)
            k[j+1]=k[j];
        //以上两步用于把比当前元素大的往后调
        //一旦检测到已排序好序列中有比当前元素小的，则把当前元素插到该元素后面
        k[j+1]=tmp;    
    }
   
}

我们用【49,38,97,76,65,13,27,50】这个数组检测一下效果：

没毛病，跟我们刚刚手动计算的一样。

排序的时间效率 ：

时间效率主要和排序过程中元素之间的比较次数直接有关。

原始序列按值递增：那么每一趟排序，第一次比较，也就是和当前需要调整元素的前一个元素比较时，就跳出循环了，因为比当前需要调整元素小。因此每个元素进行调整时，都只需要比较1次，那么总共有n-1个元素需要调整，就一共比较n-1次。
原始序列按值递减：第i趟排序需要和前i个元素都比较一次，因此，整个n-1趟排序需要比较（1+n-1)*(n-1)/ 2=n（n-1）/ 2次

如果以最坏的情况，也就是原始序列递减情况，则插入排序算法的时间复杂度为O（n²）。

由于我们只把比当前元素大的元素向后调，相等的元素不调，因此调整之后，值相等的两个元素的相对位置在排序前后并未改变，则插入排序算法是稳定的。

由于没有开辟新的空间，因此插入排序算法的空复杂度为O（1）。

折半插入排序法

这个算法的整体思想和插入法一样，只是在找插入位置的时候，用了折半查找的方法，基于前i-1个元素是有序的。

找到位置的标志，也就是某一趟排序中循环停止的标志为high<low,插入位置即为low。

c 复制代码

void BinInsertSort(int k[],int n)
{
    int i,j;
    int high,low,mid;
    for(i=1;i<n;i++)
    {
        int tmp=k[i];
        high=i-1;
        low=0;
        while(high>=low)
        {
            mid=(high+low)/2;
            if(tmp>=k[mid])//将相等情况也纳入，保证了稳定性 
                low=mid+1;
            else
                high=mid-1;
        }
        for(j=i;j>low;j--)
            k[j]=k[j-1];
        k[low]=tmp;
    }
}

选择排序

动画演示 ：

核心思想 ：

第i趟排序，从序列的后n-i+1个元素中选择一个值最小的元素，将其置于该n-i+1个元素的最前面（与第i个元素交换）

静态演示 ：

红框框起来的表示这一趟中判断出的最小元素，红色部分表示已经排好序的部分。
共有8个元素，但只排7次。和插入排序一样。

c 复制代码

void selectsort(int k[],int n)
{
    int i,j,d;//d用于记录最小元素的下标
    int temp;
    for(i=0;i<n-1;i++)
    {
        d=i;
        for(j=i+1;j<n;j++)
        {
            if(k[j]<k[d])
                d=j;
        }
        Swap(&k[d],&k[i]);
    }
}

方法2

c 复制代码

void selectsort2(int k[],int n)
{
    int i,j,tmp;
    for(i=0;i<n;i++)
       for(j=i+1;j<n;j++)
           if(k[j]<k[i])
               Swap(&k[j],&k[i]);
}

冒泡排序

动画演示 ：

核心思想：第i趟中，对序列的**前n-i+1个元素，从第一个元素开始，相邻的两个元素比较大小，若前者大于后者，则交换。

静态演示 ：

我们发现，选择和插入排序都进行了n-1次，但是为什么冒泡排序小于n-1呢？前两者循环结束的条件都是i，j和n比较，但是冒泡排序，我们需要定义一个变量flag，用于记录，在某趟排序中，是否进行了元素交换。如果进行了，哪怕只有一次，那下一趟循环继续；如果一次也没有，就说明此时序列已经有序，不需要再进行下一趟了。

c 复制代码

void bubblesort(int k[],int n)
{
    int i,j,flag=1;
    for(i=n-1;i>0&&flag==1;i--)
    {
        flag=0;
        for(j=0;j<i;j++)
        {
            if(k[j]>k[j+1])
            {
                Swap(&k[j],&k[j+1]);
                flag=1;
            }     
        }
    } 
}

效率分析 ：

冒泡排序算法的排序趟数和原始序列的排序有关，因此排序趟数为【1，n-1】。

排序趟数最少为1次，即原始序列本身就有序。

最多为n-1次，原始序列为逆序。

因此，冒泡排序的时间复杂度，在最少次数下为O(n),即只进行一轮；在最多次数下为O（n²）

冒泡排序过程中，如果两个数相等，则不进行交换，因此是稳定的。

希尔排序

把整个序列分成若干子序列，每个子序列内部先排序。
在每一趟排序结果均是按照上一趟分好的组（颜色一眼的）进行组内排序的结果（组内排序可以用各种排序方法，插入、冒泡都行）。

每组元素的间隔数满足：

即每一次的gap都是上一次的一半。gap等于1时，整个数组为一个组进行排序，也就是最后一次排序。

每进行一趟排序，数组都会更加接近有序。

我们这里先展示一种组内排序为冒泡排序的希尔排序方法：

c 复制代码

void shellsort1(int k[],int n)
{
    int i,j,flag,gap=n;
    //flag用于检测每一趟冒泡排序是否有进行交换，如果没有进行交换，就说明
    //数组已经有序了，不用继续进行排序了
    int temp;
    while(gap>1)
    {
        gap=gap/2;
        do
        {
            flag=0;
            for(i=0;i<n-gap;i++)
            {
                j=i+gap;
                if(k[j]<k[i])
                    Swap(&k[i],&k[j]);
            }     
        } while (flag==1);   
    }
}

再来展示一种内部排序为插入排序的希尔排序：

c 复制代码

void shellsort2(int k[],int n)
{
    int i,j,temp,gap=n;
    while(gap>1)
    {
        gap=gap/2;
        for(i=gap;i<n;i++)
        {
            temp=k[i];
            for(j=i;j>=gap&&k[j-gap]>temp;j-=gap)
                k[j]=k[j-gap];
            k[j]=temp;
        }
    }
}

效率分析 ：

举个反例就发现，希尔排序是不稳定的了：

【2a,3,4,1,2b,5,6,8】我们让gap=3,则【2a,1,6】是一组，【3,2b,8】是一组，【4,5】一组。

那么第一趟排序的结果就是：

【1,2b,4,2a,3,5,6,8】我们发现，两个2的相对位置发生了变化，因此不稳定。

希尔排序的时间复杂度比较难搞，我们认为在O（nlogn）和O（n²）之间。

堆排序

之前写过一篇专门讲堆排序的文章:link，但是在本次排序专题里，再把它写一次。

动画演示 ：

核心思想 ：先对原始数组进行向下调整 ，从第一个非叶子结点 开始进行。待所有结点都调整完毕之后，形成了一个大堆，然后，依次将堆顶和当前堆 的最后个元素交换位置，换完之后进行向下调整。

c 复制代码

void AjustDown(int k[],int n,int parent)
{
    int child=2*parent+1;
    while(child<n)
    {
        if(child+1<n&&k[child+1]>k[child])
            ++child;
        if(k[child]>k[parent])
        {
            Swap(&k[child],&k[parent]);
            parent=child;
            child=child*2+1;
        }
        else
            break;
    }
}
void heapsort(int k[],int n)
{
    for(int i=(n-1-1)/2;i>=0;i--)
    {
        AjustDown(k,n,i);
    }
    //建好堆了，下面开始排序
    int end=n-1;
    while(end>0)
    {
        Swap(&k[end],&k[0]);
        AjustDown(k,end,0);
        end--;
    }
}

效率分析

时间主要消耗在向下调整了，那么每个元素，都要经过向下调整，调整的次数最多为高度次，即logn，有n个元素，则时间复杂度为O（nlogn）。

堆排序显然也不稳定，调整算法压根没有考虑过数组之间的关系，只考虑了堆的结构。

二路归并排序

动画演示 ：
核心思想 ：

第i趟排序将序列的n/2^ (i-1) 个长度为 2^ (i-1) 的有序子序列依次两两合并为n/2^ i 个长度为2^i的有序子序列。

静态演示 ：

如果n不等于2^ k ，则：

最后一趟在不等长的两个序列中进行就可以。

大家看到这个基本思路，就知道它大概率是要用到递归的思路的，这种一环套一环，每一环的都基于上一环的结果。

从动态图中我们也能看出来，归并排序是需要一个临时数组的，辅助我们为子序列排序。

c 复制代码

void _mergesort(int k[],int begin,int end,int* tmp)
{
    if(begin==end)
        return;
    
    int mid=(begin+end)/2;
    //[begin,mid][mid+1,end]
    _mergesort(k,begin,mid,tmp);
    _mergesort(k,mid+1,end,tmp);
    //左右都排好以后，我们来合并：
    int begin1=begin,end1=mid;
    int begin2=mid+1,end2=end;
    int i=begin1;
    while(begin1<=end1&&begin2<=end)
    {
        if(k[begin1]<k[begin2])
            tmp[i++]=k[begin1++];
        else
            tmp[i++]=k[begin2++];
    }
    while(begin1<=end1)
        tmp[i++]=k[begin1++];
    while(begin2<=end2)
        tmp[i++]=k[begin2++];

    memcpy(k+begin,tmp+begin,sizeof(int)*(end-begin+1));
}
void mergesort(int k[],int n)
{
    int* tmp=(int*)malloc(sizeof(int)*n);
    _mergesort(k,0,n-1,tmp);

    free(tmp);
    tmp=NULL;
}

效率分析 ：

当子序列个数为1（n不是2的次幂时为2个），即n/2^ i 为1的时候，排序完成，即排了logn趟。子序列内部排序的时间复杂度主要来源于归并部分的while循环，时间复杂度为O（n），因此，归并排序的时间复杂度为O（nlogn）。

由于开辟了tmp数组，因此空间复杂度时O（n）。

是稳定的。

快速排序

动画演示 ：
为什么右边的先走呢？因为右边的先走可以保证L和R相遇的位置处元素，一定小于key。

c 复制代码

void quicksort(int k[],int left,int right)
{
    if(left>=right)
        return;
    int begin=left,end=right;
    int keyi=left;

    while(left<right)
    {
        //right先走，找比key小的
        while(left<right&&k[keyi]<=k[right])//为了防止整个序列里面keyi的右边全部比它大，加一个left<right，以防right一股脑冲出数组头
            right--;
        //left再走，找比key大的
        while(left>right&&k[keyi]>=k[left])
            left++;
        
        Swap(&k[left],&k[right]);
    }
    Swap(&k[left],&k[keyi]);
    keyi=left;
    //[begin,keyi-1][keyi+1,end]
    quicksort(k,begin,keyi-1);
    quicksort(k,keyi+1,end);
}

效率分析 ：