【数据结构】数据结构

本文是基于中国MOOC平台上,华中科技大学的《数据结构》课程和浙江大学的《数据结构》课程所作的一篇课程笔记,便于后期讲行系统性查阅和复习。

从个人角度出发,两个课程的讲解都有点不太易懂,好在多处可以互补,搭配进行学习还可以。


一、基础概念

1.1 什么是数据结构

1.1.1 解决问题方法的效率,与什么有关?

解决问题方法的效率,跟数据的组织方式有关。

解决问题方法的效率,跟空间的利用效率有关。

解决问题方法的效率,跟算法的巧妙程度有关。
引入案例:如何在书架上摆放书架?

分析案例:图书的摆放要使得两个操作方便实行

1.新书怎么插入?

2.怎么找到某本指定的书?

算法一:随便放。

操作1有空就放,一步到位。操作2需要遍历书架,复杂度高。

算法二:按照书名的拼音字母顺序排放。

操作1每插入一本新书就要把后面的书进行调整,复杂度高。操作2二分查找。

算法三:分而治之法,书架按块放不同类别的书,每一类里按拼音字母顺序排放。

操作1先定类别,二分查找位置,移出空位。操作2先定类别,再二分查找。

对比之下,算法三更优。

优化:空间如何分配?类别应该分多细?

解决问题方法的效率,跟数据的组织方式有关。
引入案例:写程序实现一个函数PrintN,使得传入一个正整数为N的参数后,能顺序打印从1到N的全部正整数。

算法一:for循环

cpp 复制代码
void PrintN(int N) {
	for (int i = 1; i < N + 1; i++) {
		printf("%d\n", i);
	}
	return;
}

算法二:递归函数

cpp 复制代码
void PrintN(int N) {
	if (N) {
		PrintN(N - 1);
		printf("%d\n", N);
	}
	return;
}

实际上,在测试代码过程中,N的取值有10、100、1000、10000,而在10、100、1000时两种代码均能跑通。在10000时,递归函数出现了错误,原因是内存不足。

解决问题方法的效率,跟空间的利用效率有关。
引入案例:写程序计算给定多项式在给定点x处的值。

算法一:傻瓜法

cpp 复制代码
double f(int n, double a[], double x) {
	int i;
	double p = a[0];
	for (i = 1; i <= n; i++) 
		p += (a[i] * pow(x, i));
		return p;
}

算法二:秦久韶算法

cpp 复制代码
double f(int n, double a[], double x) {
	int i;
	double p = a[n];
	for (i = n; i >0; i--) 
		p = a[i - 1] + x * p;
		return p;
}

对比算法:算法二的运行时间更短。

解决问题方法的效率,跟算法的巧妙程度有关。

1.1.2 什么是数据结构?

数据结构是数据对象在计算机中的组织方式。

(数据对象的逻辑结构,数据对象在计算机中的物理存储结构)

•数据对象必定与一系列加在其上操作相关联

•实现这些操作所用的方法就是算法。
抽象数据类型

•抽象数据类型是对数据的逻辑描述,而数据结构是对数据的物理描述。抽象数据类型定义了数据的操作和语义,而数据结构实现了这些操作和语义。因此,可以说抽象数据类型是数据结构的一种实现方式。

•数据类型:数据对象集+数据集合相关联的操作集

•抽象:描述数据类型的方法不依赖于具体实现。

(与存放数据的机器无关,与数据存储的物理结构无关,与实现操作的算法编程语言无关)

(只描述数据对象集和相关操作集"是什么",并不涉及"如何做到"的问题)

1.2 什么是算法

1.2.1 算法的定义

•算法

•一个有限指令集

•接收一些输入(有些情况不需要输入),产生输出

•有穷性:一定在有限步骤之后终止

•确定性:每一条指令必须有充分明确的目标,不可以有歧义

•可行性:每一条指令必须计算机能处理的范围之内

•伪代码:算法描述应不依赖于任何一种计算机语言以及具体的实现手段

1.2.2 什么是好的算法

•衡量好算法的指标:空间复杂度S(n),时间复杂度T(n)。

•在分析一般算法的效率时,经常关注下面两种复杂度:

1.最坏情况复杂度:

2.平均复杂度:

通常,我们更常用

1.2.3 复杂度的渐进表示

•**T(n)=O(f(n))**最坏情况复杂度

表示存在常数C>0,n0>0,使得n>=n0时有

•**T(n)=Ω(g(n))**最好情况复杂度

表示存在常数C>0,n0>0,使得n>=n0时有

•**T(n)=Θ(h(n))**平均复杂度

表示同时有(n)=O(h(n))和T(n)=Ω(h(n))
复杂度分析小窍门

•若两段算法分别有复杂度,则

算法相接:

算法嵌套:

•若T(n)是关于n的k阶多项式,那么

•一个for循环的时间复杂度=循环次数*循环体代码复杂度

if-else语句的时间复杂度=max{if的条件判断复杂度,if分支的复杂度,else分支的复杂度}

1.3 应用实例

1.3.1 最大子列和问题

问题:给定N个整数的序列{},求函数f(i,j)=max{0,}的最大值。

算法一:暴力破解(三个嵌套for循环,复杂度

cpp 复制代码
int MaxSubseqSum1(int A[], int N) {
	int ThisSum=0, MaxSum = 0;
	int i, j, k;
	for (i = 0; i < N; i++) {
		for (j = i; j < N; j++) {
			for (k = i; k <= j; k++) {
				ThisSum += A[k];
			}
			if (ThisSum > MaxSum) {
				MaxSum = ThisSum;
			}
		}
	}
	return MaxSum;
}

算法二:暴力破解改良版(两个嵌套for循环,复杂度

cpp 复制代码
int MaxSubseqSum1(int A[], int N) {
	int ThisSum=0, MaxSum = 0;
	int i, j, k;
	for (i = 0; i < N; i++) {
		for (j = i; j < N; j++) {
				ThisSum += A[j];
			if (ThisSum > MaxSum) {
				MaxSum = ThisSum;
			}
		}
	}
	return MaxSum;
}

算法三:分而治之()

思想上,将大的问题划分为小的块,逐层划分到最小单位。行动上,从最小单位逐层解决问题,直到解决问题。

相关推荐
秋夫人1 分钟前
B+树(B+TREE)索引
数据结构·算法
代码雕刻家30 分钟前
数据结构-3.1.栈的基本概念
c语言·开发语言·数据结构
AlexMercer101242 分钟前
【C++】二、数据类型 (同C)
c语言·开发语言·数据结构·c++·笔记·算法
^^为欢几何^^3 小时前
lodash中_.difference如何过滤数组
javascript·数据结构·算法
ahauedu4 小时前
案例分析-Stream List 中取出值最大的前 5 个和最小的 5 个值
数据结构·list
X同学的开始6 小时前
数据结构之二叉树遍历
数据结构
AIAdvocate9 小时前
Pandas_数据结构详解
数据结构·python·pandas
jiao000019 小时前
数据结构——队列
c语言·数据结构·算法
kaneki_lh9 小时前
数据结构 - 栈
数据结构
铁匠匠匠9 小时前
从零开始学数据结构系列之第六章《排序简介》
c语言·数据结构·经验分享·笔记·学习·开源·课程设计