【数据结构】一、数据结构的基本概念

基本概念

数据是信息的载体 ,是描述客观事物属性的数、字符及所有能输入到计算机中并被计算机程序识别处理的符号的集合。

数据是计算机程序加工的原料。

数据元素 是数据的基本单位。通常作为一个整体进行考虑和处理,用一个数据元素 描述一个个体。一个数据元素可由若干数据项组成。

数据项是构成数据元素的不可分割的最小单位。数据项如果再细分,可以称这个数据项是组合项。例如时间可以拆分为年月日。

数据对象 是具有相同性质的数据元素的集合,是数据的一个子集。

  • 数据对象:人
    • 数据元素:具有相同性质,出生日
      • 数据项
      • 组合项:年月日

数据结构 是相互之间存在一种或多种特定关系的数据元素的集合。

数据结构这门课着重关注的是数据元素之间的关系,和对这些数据元素的操作,而不关心具体的数据项内容。

数据类型是一个值的集合和定义在此集合上的一组操作的总称。

  • 原子类型:其值不可再分的数据类型;

bool类型,int类型

  • 结构类型:其值可以再分解为若干成分(分量)的数据类型。

结构体

抽象数据类型(Abstract Data Type, ADT):是抽象数据组织及与之相关的操作。

定义一个ADT 就是在"定义"一种数据结构,确定了ADT的存储结构,才能实现这种数据结构。

数据结构三要素

  • 逻辑结构

    • 集合结构

    • 线性结构:一对一

    • 树形结构:一对多

    • 图形结构:多对多

  • 数据运算

  • 物理结构(存储结构)

    • 顺序存储:物理上相邻
    • 非顺序(离散)存储:物理上不相邻
      • 链式存储
      • 索引存储
      • 散列存储

若采用顺序存储,则各个数据元素在物理上必须是连续的;若采用非顺序存储,则各个数据元素在物理上可以是离散的。

数据的存储结构会影响存储空间分配的方便程度

数据的存储结构会影响对数据运算的速度。Eg:在b和d之间插入新元素c

算法

程序 = 数据结构 + 算法

数据结构:要处理的信息。

算法:处理信息的步骤。

算法(Algorithm)是对特定问题求解步骤的一种描述,它是指令的有限序列,其中的每条指令表示一个或多个操作。

算法必须具备的5特性

  1. 有穷性:一个算法必须总在执行有穷步之后结束,且每一步都可在有穷时间内完成。注:算法必须是有穷的,而程序可以是无穷的。
  2. 确定性 :算法中每条指令必须有确切的含义,对于相同的输入只能得出相同的输出
  3. 可行性:算法中描述的操作都可以通过已经实现的基本运算执行有限次来实现。
  4. 输入 :一个算法有零个或多个输入(随意有无数量),这些输入取自于某个特定的对象的集合。
  5. 输出 :一个算法有一个或多个输出(必须有),这些输出是与输入有着某种特定关系的量。

好算法的特性

  • 正确性:算法应能够正确地解决求解问题。
  • 可读性:算法应具有良好的可读性,以帮助人们理解。
  • 健壮性:输入非法数据时,算法能适当地做出反应或进行处理,而不会产生莫名其妙的输出结果。
  • 高效率:时间复杂度低,花费时间少。
  • 低存储量需求:空间复杂度低,不费内存。

算法效率的度量

先让算法运行,事后统计时间?因为在不同的机器上运行的时间不同,所以不具有参考,这样不可以。还存在什么问题?

  1. 和机器性能有关,如:超级计算机 v.s.单片机
  2. 和编程语言有关,越高级的语言执行效率越低
  3. 和编译程序产生的机器指令质量有关
  4. 有些算法是不能事后再统计的,如:导弹控制算法
时间复杂度

时间开销与问题规模 n 之间的关系

事前预估算法时间开销T(n)与问题规模 n 的关系(T表示"time" )

  1. 加法规则:多项相加,只保留最高阶的项,且系数变为1:

T ( n ) = T 1 ( n ) + T 2 ( n ) = O ( f ( n ) ) + O ( g ( n ) ) = O ( m a x ( f ( n ) , g ( n ) ) ) \begin{equation}\begin{split} T(n) &= T_1(n) + T_2(n) \\ & = O(f(n)) + O(g(n)) \\ & = O( max( f(n), g(n) )) \end{split}\end{equation} T(n)=T1(n)+T2(n)=O(f(n))+O(g(n))=O(max(f(n),g(n)))

  1. 乘法规则:多项相乘,都保留

T ( n ) = T 1 ( n ) × T 2 ( n ) = O ( f ( n ) ) × O ( g ( n ) ) \begin{equation}\begin{split} T(n) &= T_1(n) × T_2(n) \\ & = O(f(n)) × O(g(n)) \\ \end{split}\end{equation} T(n)=T1(n)×T2(n)=O(f(n))×O(g(n))

Eg:
T 3 ( n ) = n 3 + n 2 l o g 2 n = O ( n 3 ) + O ( n 2 l o g 2 n ) = O ( n 3 ) \begin{equation}\begin{split} T_3(n) &= n^3 + n^2 log_2n \\ & = O(n^3) + O(n^2 log_2n) \\ & = O(n^3) \end{split}\end{equation} T3(n)=n3+n2log2n=O(n3)+O(n2log2n)=O(n3)

结论:

  • 结论1:顺序执行的代码只会影响常数项,可以忽略。
  • 结论2:只需挑循环中的一个基本操作分析它的执行次数与n 的关系即可。
  • 结论3:如果有多层嵌套循环,只需关注最深层循环循环了几次。

三种复杂度

  • 最坏时间复杂度:最坏情况下算法的时间复杂度。
  • 平均时间复杂度:所有输入示例等概率出现的情况下,算法的期望运行时间。
  • 最好时间复杂度:最好情况下算法的时间复杂度。
复杂度排行

常数,对数,线性,线性对数,平方,立方,指数,阶乘,幂指时间复杂度
O ( 1 ) < O ( l o g 2 n ) < O ( n ) < O ( n l o g 2 n ) < O ( n 2 ) < O ( n 3 ) < O ( 2 n ) < O ( n ! ) < O ( n n ) O(1) <O(log_2n)< O(n) < O(nlog_2n) < O(n^2) <O(n^3)<O(2^n)< O(n!) <O(n^n) O(1)<O(log2n)<O(n)<O(nlog2n)<O(n2)<O(n3)<O(2n)<O(n!)<O(nn)

空间复杂度

空间开销(内存开销)与问题规模 n 之间的关系

无论问题规模怎么变,算法运行所需的内存空间都是固定的常量,算法空间复杂度为 S(n)= O(1)

注:S表示"Space"。

算法原地工作------算法所需内存空间为常量

  1. 变量定义会增加内存开销

e.g.:int a;一个int:4B,那么就有S(n) = O(4) = O(1)

int a[n]; 那么就有S(n) = O(4n) = O(n)

int a[n][n]; 那么就有S(n) = O(n^2)

  1. 函数递归调用带来的内存开销

空间复杂度 = 递归调用深度

相关推荐
Lenyiin5 分钟前
01.02、判定是否互为字符重排
算法·leetcode
小林熬夜学编程9 分钟前
【Linux网络编程】第十四弹---构建功能丰富的HTTP服务器:从状态码处理到服务函数扩展
linux·运维·服务器·c语言·网络·c++·http
倔强的石头10620 分钟前
【C++指南】类和对象(九):内部类
开发语言·c++
鸽鸽程序猿21 分钟前
【算法】【优选算法】宽搜(BFS)中队列的使用
算法·宽度优先·队列
Jackey_Song_Odd21 分钟前
C语言 单向链表反转问题
c语言·数据结构·算法·链表
Watermelo61725 分钟前
详解js柯里化原理及用法,探究柯里化在Redux Selector 的场景模拟、构建复杂的数据流管道、优化深度嵌套函数中的精妙应用
开发语言·前端·javascript·算法·数据挖掘·数据分析·ecmascript
乐之者v30 分钟前
leetCode43.字符串相乘
java·数据结构·算法
A懿轩A1 小时前
C/C++ 数据结构与算法【数组】 数组详细解析【日常学习,考研必备】带图+详细代码
c语言·数据结构·c++·学习·考研·算法·数组
古希腊掌管学习的神2 小时前
[搜广推]王树森推荐系统——矩阵补充&最近邻查找
python·算法·机器学习·矩阵
云边有个稻草人2 小时前
【优选算法】—复写零(双指针算法)
笔记·算法·双指针算法