数据结构——算法的时间复杂度和空间复杂度

前言

一、数据结构和算法

[1.1 算法的效率](#1.1 算法的效率)

[1.2 算法的复杂度](#1.2 算法的复杂度)

二、时间复杂度

[2.1 时间复杂度的概念](#2.1 时间复杂度的概念)

[2.2 大O的渐进表示法](#2.2 大O的渐进表示法)

前言

今天我们来学习一下数据结构和算法的时间和空间复杂度，了解如何来评价一个算法的好坏。

一、数据结构和算法

数据结构 (Data Structure) 是计算机存储、组织数据的方式，指相互之间存在一种或多种特定关系的数据元素的集合，是在内存中用来管理数据的结构。
算法就是定义良好的计算过程，他取一个或一组的值为输入，并产生出一个或一组值作为
输出。简单来说算法就是一系列的计算步骤，用来将输入数据转化成输出结果。
算法定义了如何在数据结构上执行操作。算法的选择和设计必须考虑到所使用的数据结构，因为同一种算法可能依赖于不同的数据结构来实现，从而影响其效率和实用性

1.1 算法的效率

我们如何来衡量一个算法的好坏呢
我们来看下面的代码：

cpp 复制代码

long long Fib(int N)
{
   if(N < 3)
     return 1;
 
  return Fib(N-1) + Fib(N-2);
}

斐波那契数列的递归实现方式非常简洁，但简洁一定好吗？那该如何衡量其好与坏呢？
我们通过算法的复杂度来衡量算法的效率。

1.2 算法的复杂度

算法在编写成可执行程序后，运行时需要耗费时间资源和空间(内存)资源。因此衡量一个算法的好坏，一般是从时间和空间两个维度来衡量的，即时间复杂度和空间复杂度。
时间复杂度主要衡量一个算法的运行快慢，而空间复杂度主要衡量一个算法运行所需要的额外空间。在计算机发展的早期，计算机的存储容量很小。所以对空间复杂度很是在乎。但是经过计算机行业的迅速发展，计算机的存储容量已经达到了很高的程度。所以我们如今已经不需要再特别关注一个算法的空间复杂度。

二、时间复杂度

2.1 时间复杂度的概念

时间复杂度的定义：在计算机科学中，算法的时间复杂度是一个函数 (这里函数指数学意义上的函数)，它定量描述了该算法的运行时间。一个算法执行所耗费的时间，从理论上说，是不能算出来的，只有你把你的程序放在机器上跑起来，才能知道。但是我们需要每个算法都上机测试吗？是可以都上机测试，但是这很麻烦，所以才有了时间复杂度这个分析方式。一个算法所花费的时间与其中语句的执行次数成正比例，算法中的基本操作的执行次数，为算法 的时间复杂度。
即：找到某条基本语句与问题规模N之间的数学表达式，就是算出了该算法的时间复杂度。

cpp 复制代码

// 请计算一下Func1中++count语句总共执行了多少次？
void Func1(int N)
{
    int count = 0;
    for (int i = 0; i < N ; ++ i)
    {
     for (int j = 0; j < N ; ++ j)
     {
     ++count;
     }
    }
 
    for (int k = 0; k < 2 * N ; ++ k)
    {
     ++count;
    }
    int M = 10;
    while (M--)
    {
     ++count;
    }
printf("%d\n", count);
}

Func1 执行的基本操作次数：
N = 10 F(N) = 130
N = 100 F(N) = 10210
N = 1000 F(N) = 1002010
实际中我们计算时间复杂度时，我们其实并不一定要计算精确的执行次数，而只需要大概执行次数，那么这里我们使用大O的渐进表示法。

2.2 大O的渐进表示法

大O符号（Big O notation）：是用于描述函数渐进行为的数学符号。
推导大O阶方法：
1、用常数1 取代运行时间中的所有加法常数。
2、在修改后的运行次数函数中，只保留最高阶项。
3、如果最高阶项存在且不是1，则去除与这个项目相乘的常数。得到的结果就是大O阶。
使用大O的渐进表示法以后，Func1的时间复杂度为：
N = 10 F(N) = 100
N = 100 F(N) = 10000
N = 1000 F(N) = 1000000
通过上面我们会发现大O的渐进表示法去掉了那些对结果影响不大的项，简洁明了的表示出了执行次数。
另外有些算法的时间复杂度存在最好、平均和最坏情况：
最坏情况：任意输入规模的最大运行次数(上界)
平均情况：任意输入规模的期望运行次数
最好情况：任意输入规模的最小运行次数(下界)
例如：在一个长度为N数组中搜索一个数据x
最好情况：1次找到
最坏情况：N次找到
平均情况：N/2次找到
在实际中一般情况关注的是算法的最坏运行情况，所以数组中搜索数据时间复杂度为O(N)

2.3常见时间复杂度计算举例

实例1：

cpp 复制代码

// 计算Func2的时间复杂度？
void Func2(int N)
{
    int count = 0;
    for (int k = 0; k < 2 * N ; ++ k)
     {
         ++count;
     }
     int M = 10;
     while (M--)
     {
         ++count;
     }
 printf("%d\n", count);
}

其中for循环次数2N，while循环常数次，所以时间复杂度为2N+10，用大O的渐进表示法为O(N)。
实例2：

cpp 复制代码

// 计算Func3的时间复杂度？
void Func3(int N, int M)
{
     int count = 0;
     for (int k = 0; k < M; ++ k)
     {
         ++count;
     }
     for (int k = 0; k < N ; ++ k)
     {
         ++count;
     }
 printf("%d\n", count);
}

两个for循环次数分别为M，和N，执行了M+N次，时间复杂度为O(M+N)。
实例3：

cpp 复制代码

// 计算Func4的时间复杂度？
void Func4(int N)
{
     int count = 0;
     for (int k = 0; k < 100; ++ k)
     {
         ++count;
     }
 printf("%d\n", count);
}

其中for循环执行次数为常数次，所以时间复杂度为O(1)。

实例4：

cpp 复制代码

// 计算strchr的时间复杂度？
const char * strchr ( const char * str, int character );

该函数为查询字符串中有无字符，遍历字符串，最好1次，最坏N次。所以时间复杂度为O(N)。

实例5：

cpp 复制代码

// 计算BubbleSort的时间复杂度？
void BubbleSort(int* a, int n)
{
     assert(a);
     for (size_t end = n; end > 0; --end)
     {
         int exchange = 0;
         for (size_t i = 1; i < end; ++i)
         {
             if (a[i-1] > a[i])
             {
                 Swap(&a[i-1], &a[i]);
                 exchange = 1;
             }
         }
     if (exchange == 0)
         break;
     }
}

以上为一个冒泡排序，基本操作执行最好N次，最坏执行了(N*(N+1)/2次，通过推导大O阶方法+时间复杂度一般看最坏，时间复杂度为 O(N^2)
实例6：

cpp 复制代码

// 计算BinarySearch的时间复杂度？
int BinarySearch(int* a, int n, int x)
{
     assert(a);
     int begin = 0;
     int end = n-1;
 // [begin, end]：begin和end是左闭右闭区间，因此有=号
     while (begin <= end)
     {
         int mid = begin + ((end-begin)>>1);
         if (a[mid] < x)
             begin = mid+1;
         else if (a[mid] > x)
             end = mid-1;
         else
             return mid;
     }
     return -1;
}

以上为二分查找，基本操作执行最好1次，最坏O(logN)次，时间复杂度为 O(logN) ps：logN在算法分析中表示是底数为2，对数为N。（建议通过折纸查找的方式讲解logN是怎么计算出来的）
实例7：

cpp 复制代码

// 计算阶乘递归Fac的时间复杂度？
long long Fac(size_t N)
{
     if(0 == N)
     return 1;
 
 return Fac(N-1)*N;
}

每次调用Fac的时间复杂度为O(1)，调用N次，时间复杂度为O(N)。

实例8:

cpp 复制代码

// 计算斐波那契递归Fib的时间复杂度？
long long Fib(size_t N)
{
     if(N < 3)
     return 1;
 
 return Fib(N-1) + Fib(N-2);
}

调用次数为一个等比数列递增，为递归了2^N次，时间复杂度为O(2^N)。

三、空间复杂度

空间复杂度也是一个数学表达式，是对一个算法在运行过程中临时占用存储空间大小的量度。
空间复杂度不是程序占用了多少bytes的空间，因为这个也没太大意义，所以空间复杂度算的是变量的个数。
空间复杂度计算规则基本跟实践复杂度类似，也使用大O渐进表示法。
注意：函数运行时所需要的栈空间(存储参数、局部变量、一些寄存器信息等)在编译期间已经确定好了，因 此空间复杂度主要通过函数在运行时候显式申请的额外空间来确定。
实例1：

cpp 复制代码

// 计算BubbleSort的空间复杂度？
void BubbleSort(int* a, int n)
{ 
    assert(a);
     for (size_t end = n; end > 0; --end)
     {
         int exchange = 0;
         for (size_t i = 1; i < end; ++i)
         {    
             if (a[i-1] > a[i])
             {
                 Swap(&a[i-1], &a[i]);
                 exchange = 1;
             }
         }
     if (exchange == 0)
         break;
     }
}

使用了常数个额外空间，所以空间复杂度为 O(1)
实例2：

cpp 复制代码

// 计算Fibonacci的空间复杂度？
// 返回斐波那契数列的前n项
long long* Fibonacci(size_t n)
{
     if(n==0)
         return NULL;
 
     long long * fibArray = (long long *)malloc((n+1) * sizeof(long long));
     fibArray[0] = 0;
     fibArray[1] = 1;
     for (int i = 2; i <= n ; ++i)
     {
         fibArray[i] = fibArray[i - 1] + fibArray [i - 2];
     }
 return fibArray;
}

动态开辟了N个空间，空间复杂度为 O(N)
因为每次左边的i-1调用完，右边的i-2的空间与前面一样，因为前面用完就回收了，后面的空间还是前一个，是重复利用的。所以只开辟了N个空间。
总结：空间是可以重复利用的，时间是累加的，一去不返回。
实例3：

cpp 复制代码

// 计算阶乘递归Fac的空间复杂度？
long long Fac(size_t N)
{
     if(N == 0)
     return 1;
 
 return Fac(N-1)*N;
}

递归调用了N次，开辟了N个栈帧，每个栈帧使用了常数个空间。空间复杂度为O(N)

四、常见复杂度对比

一般算法常见的复杂度如下：

总结

上述文章，我们讲了算法的效率分析，即时间复杂度和空间复杂度，希望对你有所以帮助。

数据结构——算法的时间复杂度和空间复杂度

前言

一、数据结构和算法

1.1 算法的效率

1.2 算法的复杂度

二、时间复杂度

2.1 时间复杂度的概念

2.2 大O的渐进表示法

2.3****常见时间复杂度计算举例

三、空间复杂度

四、常见复杂度对比

总结

2.3常见时间复杂度计算举例