提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档
文章目录
前言
一、树
1、树的概念
在学习堆之前我们需要对数据结构中的树结构先有一定的了解。数据结构中的树结构就像一棵真正的倒置的树一样。树是一种非线性的数据结构,它是由n(n>=0)个有限结点组成一个具有层次关系的集合。把它叫做树是因为它看起来像一棵倒挂的树,也就是说它是根朝上,而叶朝下的。
有一个特殊的结点,称为根结点,根节点没有前驱结点。
除根节点外,其余结点被分成M(M>0)个互不相交的集合T1、T2、......、Tm,其中每一个集合Ti(1<= i <= m)又是一棵结构与树类似的子树。每棵子树的根结点有且只有一个前驱,可以有0个或多个后继。
因此,树是递归定义的。
2、树的相关概念
节点的度 :一个节点含有的子树的个数称为该节点的度; 如上图:A的为6
叶节点或终端节点 :度为0的节点称为叶节点; 如上图:B、C、H、I...等节点为叶节点
非终端节点或分支节点 :度不为0的节点; 如上图:D、E、F、G...等节点为分支节点
双亲节点或父节点 :若一个节点含有子节点,则这个节点称为其子节点的父节点; 如上图:A是B的父节点
孩子节点或子节点 :一个节点含有的子树的根节点称为该节点的子节点; 如上图:B是A的孩子节点
兄弟节点 :具有相同父节点的节点互称为兄弟节点; 如上图:B、C是兄弟节点
树的度 :一棵树中,最大的节点的度称为树的度; 如上图:树的度为6
节点的层次 :从根开始定义起,根为第1层,根的子节点为第2层,以此类推;
树的高度或深度 :树中节点的最大层次; 如上图:树的高度为4
堂兄弟节点 :双亲在同一层的节点互为堂兄弟;如上图:H、I互为兄弟节点
节点的祖先 :从根到该节点所经分支上的所有节点;如上图:A是所有节点的祖先
子孙 :以某节点为根的子树中任一节点都称为该节点的子孙。如上图:所有节点都是A的子孙
森林:由m(m>0)棵互不相交的树的集合称为森林;
3、树的表示
树结构相对线性表就比较复杂了,要存储表示起来就比较麻烦了,既然保存值域,也要保存结点和结点之间
的关系,实际中树有很多种表示方式如:双亲表示法,孩子表示法、孩子双亲表示法以及孩子兄弟表示法
等。我们这里就简单的了解其中最常用的孩子兄弟表示法。
下面为左孩子右兄弟表示法,即结点只存储它的第一个孩子和它的右兄弟。这样就可以将一棵树的结构用代码表示出来。
c
typedef int DataType;
struct TreeNode
{
struct TreeNode* firstChild1; //存储第一个孩子结点的地址
struct TreeNode* pNextBrother; //指向其下一个兄弟结点
DataType data; //结点中的数据域
};
二、二叉树
1、二叉树概念
一棵二叉树是结点的一个有限集合,该集合:
1.或者为空。
- 由一个根节点加上两棵分别称为左子树和右子树的二叉树组成。
从上图可以看出:
1.二叉树不存在度大于2的结点 。
2.二叉树的子树有左右之分,次序不能颠倒,因此二叉树是有序树
注意:对于任意的二叉树都是由以下几种情况复合而成的:
2、特殊的二叉树
1.满二叉树 :一个二叉树,如果每一个层的结点数都达到最大值,则这个二叉树就是满二叉树。也就是
说,如果一个二叉树的层数为K,且结点总数是 ,则它就是满二叉树。
2.完全二叉树 :完全二叉树是效率很高的数据结构,完全二叉树是由满二叉树而引出来的。对于深度为K
的,有n个结点的二叉树,当且仅当其每一个结点都与深度为K的满二叉树中编号从1至n的结点一一对
应时称之为完全二叉树。 要注意的是满二叉树是一种特殊的完全二叉树。
3、二叉树的性质
1.若规定根节点的层数为1,则一棵非空二叉树的第i层上最多有2^(i-1)个结点。
-
若规定根节点的层数为1,则深度为h的二叉树的最大结点数是2^h - 1。
-
对任何一棵二叉树, 如果度为0的结点,即叶结点个数为m, 度为2的结点个数为n,则有m= n+1
-
若规定根节点的层数为1,具有n个结点的满二叉树的深度,h=log(n+1)。(ps: log(n+1)是log以2为底,n+1为对数)
-
对于具有n个结点的完全二叉树,如果按照从上至下从左至右的数组顺序对所有节点从0开始编号,则对于序号为i的结点有:
(1).若i>0,i位置节点的双亲序号:(i-1)/2;若i=0,i为根节点编号,无双亲节点
(2).若2i+1<n,左孩子序号:2i+1;若2i+1>=n,则无左孩子
(3). 若2i+2<n,右孩子序号:2i+2;若2i+2>=n,则无右孩子
4、二叉树的顺序结构
二叉树一般可以使用两种结构存储,一种顺序结构,一种链式结构。
顺序结构存储就是使用数组来存储,一般使用数组只适合表示完全二叉树,因为不是完全二叉树会有空间的浪费。而现实中使用中只有堆才会使用数组来存储,二叉树顺序存储在物理上是一个数组,在逻辑上是一颗二叉树。
5、二叉树的链式结构
本篇文章讲解的为用数组来实现完全二叉树,即堆的实现。二叉树的详细介绍可以点击下面链接进入二叉树文章。
三、堆(二叉树的顺序结构)
1、堆(二叉树的顺序结构)的介绍
普通的二叉树是不适合用数组来存储的,因为可能会存在大量的空间浪费。而完全二叉树更适合使用顺序结构存储。现实中我们通常把堆(一种二叉树)使用顺序结构的数组来存储,需要注意的是这里的堆和操作系统虚拟进程地址空间中的堆是两回事,一个是数据结构,一个是操作系统中管理内存的一块区域分段。
2、堆(二叉树的顺序结构)的概念及结构
堆的性质 :
堆中某个节点的值总是不大于或不小于其父节点的值;
堆总是一棵完全二叉树。
小根堆如图所示。其每个结点的值都大于双亲结点的值。
大根堆如图所示。其每个结点的值都小于双亲结点的值。
3、堆的实现
堆就是使用顺序结构的的数组来存储的树,所以定义堆时就是定义一个动态申请大小的数组。下面我们以建立一个小堆为例。
c
typedef int HPDataType;
typedef struct Heap
{
HPDataType* data;
int size;
int capacity;
}HP;
然后在使用堆时创建一个HP结构体就代表创建了一个堆。堆的初始化就是将堆中用来存储数据的数组先指向NULL,然后将size和capacity置为0。
c
void HeapInit(HP* php)
{
assert(php);
php->data = NULL;
php->size = 0;
php->capacity = 0;
}
当需要向堆中插入数据时,要先检查堆中存储数据的数组是否已满,如果满了就要进行扩容。
c
void HeapPush(HP* php,HPDataType x)
{
assert(php);
if (php->size == php->capacity)
{
int newCapacity = (php->capacity == 0) ? 4 : (php->capacity) * 2;
HPDataType* tmp = (HPDataType*)realloc(php->data, sizeof(HPDataType) * newCapacity);
if (tmp == NULL)
{
perror("realloc fail");
exit(-1);
}
php->data = tmp;
php->capacity = newCapacity;
}
php->data[php->size] = x;
php->size++;
//新插入的元素可能不符合堆,所以需要向上调整。
AdjustUp(php->data, php->size - 1);
}
在我们向数组中插入数据时,可能新插入的数据已经不满足小根堆的要求,这时我们就要将新插入的元素进行向上调整,即通过新插入元素在数组中的下标,找到其双亲结点,然后与双亲结点的值进行比较,如果新插入结点的值小于双亲结点的值的话,就让这两个结点的值进行比较。例如有如下图所示的一个堆。此时该堆为小根堆。
当要向数组中再插入一个5时,此时将数组中的值按堆的逻辑结构表示出来,则可以看到堆已经不满足小根堆了,这时就需要将新插入的元素5进行向上调整,使其满足小根堆的定义,
值为5的结点向上调整就是通过5的下标算出其双亲结点值为56,因为小根堆中双亲结点的值要小于子结点的值,所以要将该组父子结点的值交换。
此时交换后的数组数据变为如下图所示。
可以看到交换一次后值为5的结点还是小于它的双亲结点的值,所以还需要将5进行向上调整,即将5变为根节点。此时数组表示的小根堆才正确。到此就完成了堆中插入一个新元素,然后将该元素向上调整直到该元素到达满足小根堆的位置。
上面的向上调整的代码如下所示。
c
void Swap(HPDataType* parent, HPDataType* child)
{
assert(parent && child);
//交换内存中两个地址中的值。
HPDataType tmp = *parent;
*parent = *child;
*child = tmp;
}
void AdjustUp(HPDataType* arr, int child)
{
assert(arr);
//如果该结点还不是根结点就一直判断该结点与其父节点值的大小
while (child > 0)
{
//先求出该结点的父结点
int parent = (child - 1) / 2;
//如果该结点的值小于其父结点的值,就让这两个元素交换位置。
if (arr[child] < arr[parent])
{
//让这组父子结点交换位置
Swap(&arr[parent], &arr[child]);
//然后将新的父节点作为孩子,再次与它的父结点比较大小。
child = parent;
}
//如果该结点的值大于其父节点,说明满足小根堆的要求,则不需要处理,直接跳出循环
else
{
break;
}
}
}
因为小根堆中每次新结点插入都要进行向上调整,所以小根堆中根结点的值是最小的,当我们要删除堆中的值时,就是删除堆的根结点。此时如果直接将数组中的数据都向前移一位的话,则处理完后的数组的值转换为二叉树后不满足小根堆了。此时我们可以将数组中最后一个元素与下标为0的元素进行交换,然后将数组中下标为0的元素进行向下调整。如图此时为一个存储小根堆的数组。
当我们需要将堆的根节点进行删除时,就先将数组中下标为0的元素和最后一个元素进行交换。
此时将数组的长度-1,则值为5的结点就被删除了,可以看到此时数组并不能正确表示一个小根堆,所以此时要将根结点进行向下调整,即将根结点与它的两个孩子中最小的孩子进行比较,如果大于它的最小孩子的值,就将该对父子结点进行位置交换。交换过后就可以看到此时数组中存储的元素转换为堆后符合小根堆的定义。
c
void HeapPop(HP* php)
{
assert(php);
//先将数组中下标为0的元素与数组中最后一个元素交换
Swap(&(php->data[0]), &(php->data[php->size - 1]));
//然后此时数组中最后一个元素即为堆中最小的元素,数组长度-1即代表删除了最后一个元素
php->size--;
//然后将此时数组中下标为0的元素进行向下调整,以使数组满足小根堆的定义
AdjustDown(php->data, php->size, 0);
}
void AdjustDown(HPDataType* arr, int size, int parent)
{
assert(arr);
//先求出该父结点的左孩子
int child = 2 * parent + 1;
//如果该父结点的孩子结点的在数组中,则将该父结点与孩子结点进行比较
while (child<size)
{
//上面求的是父节点的左孩子,但是父节点要与最小的孩子结点进行比较,所以当父结点有右孩子
//且右孩子小于左孩子时,就将该父节点与右孩子进行比较
if (child+1<size&&arr[child + 1] < arr[child])
{
child++;
}
//如果该父节点大于其最小的孩子,就让这两个结点交换位置
if (arr[child] < arr[parent])
{
//该组父子结点交换位置
Swap(&arr[child], &arr[parent]);
//然后让孩子结点的位置作为父结点位置
parent = child;
//再次求出新父节点的孩子结点的位置
child = 2 * parent + 1;
}
else
{
break;
}
}
}
返回堆顶元素就是将小根堆中最小的值返回,即将数组下标为0的元素返回。
c
HPDataType HeapTop(HP* php)
{
assert(php);
if (!HeapEmpty(php))
{
return php->data[0];
}
}
判断堆是否为空和返回堆的大小直接使用size就可以判断。
c
bool HeapEmpty(HP* php)
{
assert(php);
if (php->size == 0)
{
return true;
}
else
{
return false;
}
}
int HeapSize(HP* php)
{
assert(php);
return php->size;
}
销毁堆就是将动态申请的数组的空间都释放。
c
void HeapDestroy(HP* php)
{
assert(php);
free(php->data);
php->data = NULL;
php->size = 0;
php->capacity = 0;
}
当我们建立好一个堆,然后实现了堆的上述操作后,我们就可以使用堆的一些操作来完成数组的升序或降序打印,值得注意的是,当我们要升序打印时,我们需要建立小堆,然后打印堆顶的最小元素,然后将堆顶元素删除,此时剩余元素中最小值会被处理为堆顶。这样我们每次打印的都是堆中最小的元素。当需要降序打印时,需要建立大堆,这样每次打印出来的元素都是最大值。
c
void TestHeapSort()
{
//升序打印 -- 小堆
//降序打印 -- 大堆
HP hp;
HeapInit(&hp);
int a[] = { 27,15,19,18,28,34,65,49,25,37 };
for (int i = 0; i < sizeof(a) / sizeof(a[0]); ++i)
{
//将数组中的元素依次进入堆,然后形成堆结构
HeapPush(&hp, a[i]);
}
//此时堆中每次拿出来的堆顶元素都是最小值(小堆)/最大值(大堆)
while (!HeapEmpty(&hp))
{
//打印出来堆顶元素
printf("%d ", HeapTop(&hp));
//将堆顶元素删除,此时堆中会将次小值作为新的堆顶
HeapPop(&hp);
}
printf("\n");
}
4、堆排序
当我们实现了一个堆后,我们就可以利用堆来写堆排序,我们可以使用堆的返回堆顶操作来得到堆中的最大值/最小值。我们先将目标数组中的元素都存入到堆中,然后将堆中的堆顶元素,即最大值/最小值依次存到目标数组中。但是这样实现的堆排序在使用之前还要先写一个堆数据结构,然后实现堆的一系列操作之后,才能调用该堆排序函数。并且该堆排序因为在堆中建立了一个新数组,所以有O(N)的空间复杂度。
c
void HeapSort(int* arr, int size)
{
//先建立一个堆结构;
HP hp;
HeapInit(&hp);
//然后将目标数组arr中的元素都存入堆中
for (int i = 0; i < size; i++)
{
HeapPush(&hp, arr[i]);
}
int i = 0;
//然后将堆中的堆顶元素都出来,再存入目标数组中。
while (!HeapEmpty(&hp))
{
arr[i++] = HeapTop(&hp);
//堆中最大值/最小值存到目标数组后,将堆顶元素删除,以便找到新的堆顶元素
HeapPop(&hp);
}
HeapDestroy(&hp);
}
上述的堆排序在使用前,还需要写出堆的一系列操作,真正的堆排序不要借用堆的操作,所以不使用上面的方法来写堆排序。我们可以在main函数中建立一个数组,然后将数组传入HeapSort()函数中,通过HeapSort()函数将该数组排序为升序数组或降序数组。在HeapSort()函数中,我们需要先将传进来的目标数组用向上调整或向下调整变为一个堆,然后通过将堆中最大的元素或最小的元素放入数组最后一个,次大的元素或次小的元素放入数组倒数第二个这样的方式,将数组变为升序数组或者降序数组。
此时堆排序中如果要将数组变为降序数组,则需要将数组建为小堆。如果要将数组变为升序数组,则需要将数组建为大堆。
c
void HeapSort(int* arr, int size)
{
//当要给一个数组进行堆排序时,首先我们要先将该数组变为一个堆。
//利用向上调整来建堆
//时间复杂度为O(N*logN)
//int i = 0;
//for (i = 1; i < size; i++)
//{
// //从该数组下标为1的元素开始,依次进行向上调整,依次来将arr数组变为一个堆
// AdjustUp(arr, i);
//}
//利用向下调整来建堆
//时间复杂度为O(N)
int i = 0;
for (i = (size - 1 - 1) / 2; i >= 0; --i)
{
AdjustDown(arr, size, i);
}
//此时的arr已经为一个堆,因为此时为小根堆,所以堆顶为数组中最小值,
//此时我们将数组下标为0的元素,即最小值,与数组最后一个元素交换,则数组最后一个元素存的就为最小值
//然后我们再将此时下标为0的元素向下调整,恢复数组为一个小根堆,此时数组的最后一个元素就是最小值
//依次循环得到数组的次小值存入数组倒数第二个位置中,就这样一直循环,直到剩下数组中下标为0的元素,此时下标为0的元素为最大值。
int end = size - 1;
while (end > 0)
{
Swap(&arr[0], &arr[end]);
AdjustDown(arr, end, 0);
--end;
}
}