一. 数据结构前言
1.1 什么是数据结构
数据结构(Data Structure)是计算机存储、组织数据的方式,指相互之间存在一种或多种特定关系的数据元素的集合。没有一种单一的数据结构对所有用途都有用,所以我们要学各式各样的数据结构,如:线性表、树、图、哈希等
1.2 算法
算法(Algorithm):就是定义良好的计算过程,他取一个或一组的值为输入,并产生出一个或一组值作为输出。简单来说算法就是一系列的计算步骤,用来将输入数据转化成输出结果。
所以学习数据结构也是我们非常重要的一步,它能使我们高效的储存和管理数据,也可以使程序的逻辑更加清晰,也可以有效的节省空间,同时我们也要学习更加优秀的算法,在学习算法之前我们要先认识一个概念,叫做 算法复杂度 。
二. 算法的效率
如何衡量一个算法的好坏呢?
案例:旋转数组https://leetcode.cn/problems/rotate-array/description/
思路:看到这个题目我们想到的最简单的思路应该是保存利用whlie循环k次,先保存最后一个数据,让除了最后一个数据之后的数组整体向后移动,最后再将保存的数据挪到第一位,这样循环k次就打到了我们想要的结果。
cpp
void rotate(int* nums, int numsSize, int k)
{
while(k--)
{
int end = nums[numsSize-1];
for(int i=numsSize-1;i>0;i--)
{
nums[i]=nums[i-1];
}
nums[0]= end;
}
}
可是当我们输入了上面的算法之后发现我们能通过测试,但是在提交的时候却出了问题,37/38,也就是说还是有写数值是通过不了的,那么问题究竟是出在哪里?这个算法是否有问题, 我们应该怎么样去评判一个算法的好坏?根据上面的超出时间限制就知道算法的好坏是跟运行时间有很大关系的,那我们应该怎样去评判呢 ?这里我们先不做解释,我们直接来认识一下算法中复杂度的概念。
2.1 复杂度的概念
算法在编写成可执行程序后,运行时需要耗费时间资源和空间(内存)资源 。因此衡量一个算法的好
坏,一般是从时间和空间两个维度来衡量的,即 时间复杂度和空间复杂度 。
时间复杂度主要衡量一个算法的运行快慢,而空间复杂度主要衡量一个算法运行所需要的额外空间。 在计算机发展的早期,计算机的存储容量很小。所以对空间复杂度很是在乎。但是经过计算机行业的迅速发展,计算机的存储容量已经达到了很高的程度。所以我们如今已经不需要再特别关注一个算法的空间复杂度。
2.2 时间复杂度
定义:在计算机科学中, 算法的时间复杂度是⼀个函数式T(N) ,它定量描述了该算法的运行时间。时间复杂度是衡量程序的时间效率,那么为什么不去计算程序的运行时间呢?
- 因为程序运行时间与编译环境和运行机器的配置都有关系,比如同一个算法程序,用一个老编译器进行编译和新编译器编译,在同样机器下运行时间不同。
- 同一个算法程序,用一个老低配置机器和新高配置机器,运行时间也不同。
- 并且时间只能程序写好后测试,不能写程序前通过理论思想计算评估。
那么算法的时间复杂度是一个函数式T(N)到底是什么呢?这个T(N)函数式计算了程序的执行次数。
通过C语言编译链接章节学习,我们知道算法程序被编译后生成二进制指令,程序运行,就是cpu执行这些编译好的指令。那么我们通过程序代码或者理论思想计算出程序的执行次数的函数式T(N),假设每句指令执行时间基本一样(实际中有差别,但是微乎其微),那么执行次数和运行时间就是等比正相关,这样也脱离了具体的编译运行环境。执行次数就可以代表程序时间效率的优劣。比如解决⼀个问题的算法a程序T(N) = N,算法b程序T(N) = N^2,那么算法a的效率一定优于算法b。
2.3 大O的渐进表示法
我们计算程序运行效率=每条语句执行的时间 * 运行次数,但是每条语句执行的时间我们并不能确定但是运行次数与它是呈正相关的,我们可以通过运行次数来判断它的运行效率。
对于上面的代码时间复杂度的计算,T(N)=N^2+2N+10,但是对于计算机而言,2N+10的影响非常小可以忽略不记,所以时间复杂度是N^2,实际中我们计算时间复杂度时,计算的也不是程序的精确的执行次数,精确执行次数计算起来还是很麻烦的(不同的一句程序代码,编译出的指令条数都是不一样的),计算出精确的执行次数意义也不大,因为我们计算时间复杂度只是想比较算法程序的增长量级,也就是当N不断变大时T(N)的差别,上面我们已经看到了当N不断变大时常数和低阶项对结果的影响很小,所以我们只需要计算程序能代表增长量级的大概执行次数,复杂度的表示通常使用大O的渐进表示法。所以上面的复杂度就表示为O(N^2)。
大O渐进表示法:大O符号(Big O notation):是用于描述函数渐进行为的数学符号
推导大O阶规则
- 时间复杂度函数式T(N)中,只保留最高阶项,去掉那些低阶项,因为当N不断变大时,
低阶项对结果影响越来越小,当N无穷大时,就可以忽略不计了。- 如果最高阶项存在且不是1,则去除这个项目的常数系数,因为当N不断变大,这个系数
对结果影响越来越小,当N无穷大时,就可以忽略不计了。
- T(N)中如果没有N相关的项目,只有常数项,用常数1取代所有加法常数。
2.4 时间复杂度计算示例
有了上述对复杂度的理解以及怎样用大O渐进表示法表示复杂度,我们再看些例题:
对于计算strchr的时间复杂度,我来详细解释一下,我们在查找一个字符的时候,可能在最开始的位置找到,也可能是中间,或者是最后以及没有找到,根据上面的情况我们可以分为三种,最好情况O(1),平均情况O(N/2),最坏情况O(N)。
总结
通过上面我们会发现,有些算法的时间复杂度存在最好、平均和最坏情况。
最坏情况:任意输入规模的最大运行次数(上界)
平均情况:任意输入规模的期望运行次数
最好情况:任意输入规模的最小运行次数(下界)
大O的渐进表示法在实际中一般情况关注的是算法的上界,也就是最坏运行情况。
2.5 空间复杂度
空间复杂度也是一个数学表达式,是对一个算法在运行过程中因为算法的需要额外临时开辟的空间。 空间复杂度不是程序占用了多少bytes的空间,因为常规情况每个对象大小差异不会很大, 所以空间复杂度算的是变量的个数 。
空间复杂度计算规则基本跟时间复杂度类似,也使用大O渐进表示法。
注意: 函数运行时所需要的栈空间(存储参数、局部变量、⼀些寄存器信息等)在编译期间已经确定好 了,因此空间复杂度主要通过函数在运行时候显式申请的额外空间来确定 。
2.6 空间复杂度计算示例
cpp
void BubbleSort(int* a, int n)
{
assert(a);
for (size_t end = n; end > 0; --end)
{
int exchange = 0;
for (size_t i = 1; i < end; ++i)
{
if (a[i-1] > a[i])
{
Swap(&a[i-1], &a[i]);
exchange = 1;
}
}
if (exchange == 0)
break;
}
}
上面的代码,我们计算它的空间复杂度,函数栈帧在编译期间已经确定好了,只需要关注函数在运行时额外申请的空间。BubbleSort额外申请的空间有exchange等有限个局部变量,使用了常数个额外空间因此空间复杂度为 O(1)。
2.7 复杂度算法题
https://leetcode.cn/problems/rotate-array/description/
上面的链接是我们的第一道题,通过学习了复杂度的知识我们现在重新来分析,我们刚开始的思路是循环K次将数组所有元素向后移动一位(代码不通过),原因就是我们的时间复杂度太大了,我们可以一种思路来解决问题,思路2:申请新数组空间,先将后k个数据放到新数组中,再将剩下的数据挪到新数组中,这样的话时间复杂度会减小,我们可以再次尝试:
这样就通过了。下面的思路三大家也可以尝试。 思路3:
空间复杂度 O(1)
前n-k个逆置: 4 3 2 1 5 6 7
后k个逆置 :4 3 2 1 7 6 5
整体逆置 : 5 6 7 1 2 3 4