数据结构---树和二叉树

1、树的概念及结构

1.1 树的概念

树是一种非线性 的数据结构，它是由n（n>0）个有限结点组成一个具有层次关系的集合。因为它看起来像一颗倒挂的树，也就是说它的根朝上，叶朝下。因此把它叫做树。

有一个特殊的结点，称为根结点，根结点没有前驱结点。

除了根结点外，其余结点被分为M（M>0）个互补相交的集合T1,T2....Tm，其中每一个集合又是一颗结构与树类似的子树。每棵子树的根结点有且只有一个前驱，可以由0个或多个后继。

树是递归定义的。

注意：树形结构中，子树之间不能有交集，否则就不是树形结构。

1.2 树的相关概念

树结构图

**节点的度：**一个结点含有的子树的个数成为该节点的度。如上图：A的度为6。

**叶节点或终端节点：**度为0的节点称为叶节点；如上图：B,C,H,I..等节点为分支节点。

**非终端节点或分支节点：**度不为0的节点；如上图：D、E、F、G...等节点为分支节点。

**双亲节点或父节点：**若一个节点含有子节点，则这个节点称为其子节点的父节点；如上图：A是B的父节点。

**孩子节点或子节点：**一个节点含有的子树的根节点称为该节点的子节点；如上图：B是A的孩子节点

**兄弟节点：**具有相同父节点的节点互称为兄弟节点；如上图：B、C是兄弟节点

**树的度：**一棵树中，最大的节点的度称为树的度；如上图：树的度为6

**节点的层次：**从根开始定义起，根为第1层，根的子节点为第2层，以此类推；

**树的高度或深度：**树中节点的最大层次；如上图：树的高度为4

**堂兄弟节点：**双亲在同一层的节点互为堂兄弟；如上图：H、I互为兄弟节点

**节点的祖先：**从根到该节点所经分支上的所有节点；如上图：A是所有节点的祖先

**子孙：**以某节点为根的子树中任一节点都称为该节点的子孙。如上图：所有节点都是A的子孙

**森林：**由m（m>0）棵互不相交的树的集合称为森林。

1.3 树的表示

树的结构相对线性表就1比较复杂了，要存储起来就更加麻烦，**既要保存值域，也要保存结点和结点之间的关系。**实际中树有很多表示方式：双亲表示法，孩子表示法，孩子双亲表示法以及孩子兄弟表示法等等。在本文中将介绍一种最常用的表示方法，即孩子兄弟表示法。
cpp 复制代码
typedef int DataType;
struct Node
{
    struct Node* _firstChild1; // 第一个孩子结点
    struct Node* _pNextBrother; // 指向其下一个兄弟结点
    DataType _data; // 结点中的数据域
};
孩子兄弟表示法结构如图所示，即每次记录左边孩子的地址，然后由左边孩子来找其的兄弟节点。如图，根结点A没有兄弟节点，往下找孩子节点，B为A的孩子结点，C为B的兄弟结点，由A找B，通过B找到C，C找到其孩子结点G，B继续往后找其孩子结点，找到D，通过D来找E,F;然后找E的孩子结点H，通过H找到I。从而完成二叉树结构的表示。

2.二叉树的概念及其结构

2.1 概念

一颗二叉树是结点的一个有限集合，该集合：有可能为空也有可能由一个根节点加上两棵别称为左子树和右子树的二叉树组成。

从图中可以看出：

二叉树不存在度大于2的结点。

二叉树有左右子树之分，次序不能颠倒，因此二叉树是有序树。

**注意：**对于任意的二叉树都是由以下几种情况复合而成

2.2 特殊的二叉树

**满二叉树：**一个二叉树，如果每一层的结点数都达到最大值，则这个二叉树就是满二叉树，也就说，这个二叉树层数为k，且结点的总数为2^k-1，它则是满二叉树。

**完全二叉树：**完全二叉树是效率很高的数据结构，完全二叉树是由满二叉树而引出来的。对于深度为K 的，有n个结点的二叉树，当且仅当其每一个结点都与深度为K的满二叉树中编号从1至n的结点一一对应时称之为完全二叉树。要注意的是满二叉树是一种特殊的完全二叉树。

2.3 二叉树的性质

1.若规定根结点的层数为1，则一颗非空的二叉树第i层最多有2^(i-1)个结点。

2.若规定根节点的层数为1，则深度为h的二叉树的最大结点数是2^h-1;

对任何一棵二叉树, 如果度为0其叶结点个数为n0, 度为2的分支结点个数为n2,则有 n0＝ n2＋1;

若规定根节点的层数为1，具有n个结点的满二叉树的深度，h= log2 (n+1). (ps：log2(n+1) 是log以2 为底，n+1为对数);

对于具有n个结点的完全二叉树，如果按照从上至下从左至右的数组顺序对所有节点从0开始编号，则对于序号为i的结点有：

若i>0，i位置节点的双亲序号：(i-1)/2；i=0，i为根节点编号，无双亲节点

若2i+1=n否则无左孩子

若2i+2=n否则无右孩子

2.4 二叉树的存储结构

二叉树一般可以使用两种结构存储，分别为顺序结构 和链式结构。

1. 顺序结构

顺序结构就是使用数组来进行存储，，一般使用数组只适合表示完全二叉树，因为不是完全二叉树会造成空间的浪费。而现实中，只有堆才会使用数组来进行存储。二叉树的顺序存储在物理上是一个数组，在逻辑上是一颗二叉树。

2. 链式结构

二叉树的链式结构是指用链表来表示一颗二叉树，即用连来指示元素的逻辑关系。通常使用的方法是链表中每一个结点都有三个域组成，数据域和左右指针域，左右指针分别用来表示该结点的左孩子和右孩子。链式结构又分为二叉链和三叉链。
cpp 复制代码
typedef int BTDataType;
// 二叉链
struct BinaryTreeNode
{
    struct BinTreeNode* _pLeft; // 指向当前节点左孩子
    struct BinTreeNode* _pRight; // 指向当前节点右孩子
    BTDataType _data; // 当前节点值域
}
// 三叉链
struct BinaryTreeNode
{
    struct BinTreeNode* _pParent; // 指向当前节点的双亲
    struct BinTreeNode* _pLeft; // 指向当前节点左孩子
    struct BinTreeNode* _pRight; // 指向当前节点右孩子
    BTDataType _data; // 当前节点值域
}；

3.二叉树的顺序结构及实现

3.1 二叉树的顺序结构

普通的二叉树是不适合用数组来存储的，因为可能会存在大量的空间浪费。而完全二叉树更适合使用顺序结构存储。现实中我们通常把堆(一种二叉树)使用顺序结构的数组来存储，需要注意的是这里的堆和操作系统虚拟进程地址空间中的堆是两回事，一个是数据结构，一个是操作系统中管理内存的一块区域分段。

3.2 堆的概念及结构

如果有一个关键码的集合K = { k0，k1，k2 ，k3...，kn-1 }，把它的所有元素按完全二叉树的顺序存储方式存储在一个一维数组中，并满足：，

则称为小堆(或大堆)。将根节点最大的堆叫做最大堆或大根堆，根节点最小的堆叫做最小堆或小根堆。

堆的性质：堆中某个节点的值总是不大于或不小于其父节点的值；堆总是一棵完全二叉树。

3.3 堆的实现

3.3.2 向下调整算法

现在我们给出一个数组，逻辑上看做一颗完全二叉树。我们通过从根节点开始的向下调整算法可以把它调整成一个小堆。向下调整算法有一个前提：左右子树必须是一个堆，才能调整。

3.3.3 堆的创建

下面我们给出一个数组，这个数组逻辑上可以看做一颗完全二叉树，但是还不是一个堆，现在我们通过算法，把它构建成一个堆。根节点左右子树不是堆，我们怎么调整呢？这里我们从倒数的第一个非叶子节点的子树开始调整，一直调整到根节点的树，就可以调整成堆。

int a[ ] = { 1, 5 , 3 , 8 , 7 , 6 };

3.3.4 堆的插入

先插入一个10到数组的尾上，再进行向上调整算法，直到满足堆。

3.3.5 堆的删除

删除堆是删除堆顶的数据，将堆顶的数据根最后一个数据一换，然后删除数组最后一个数据，再进行向下调整算法。

3.3.6 建堆的代码实现
cpp 复制代码
//Heap.h


#pragma once
#include<stdio.h>
#include<stdlib.h>
#include<assert.h>
#include<stdbool.h>
typedef int HPDataType;
typedef struct Heap
{
	HPDataType* _a;
	int _size;
	int _capacity;
}Heap;

// 堆的构建
void HeapCreate(Heap* hp, HPDataType* a, int n);
// 堆的销毁
void HeapDestory(Heap* hp);
// 堆的插入
void HeapPush(Heap* hp, HPDataType x);
// 堆的删除
void HeapPop(Heap* hp);
// 取堆顶的数据
HPDataType HeapTop(Heap* hp);
// 堆的数据个数
int HeapSize(Heap* hp);
// 堆的判空
int HeapEmpty(Heap* hp);
cpp 复制代码
//Heap.c

 
#define  _CRT_SECURE_NO_WARNINGS
#include"Heap.h"
void swap(HPDataType* p1, HPDataType* p2) {
	HPDataType tmp = *p1;
	*p1 = *p2;
	*p2 = tmp;
}
void Adjustdown(HPDataType* a, int n,int parent) {
	int child = parent * 2 + 1;
	while (child < n) {
		if (child + 1 < n && a[child + 1] > a[child]) {
			++child;
		}if (a[child] > a[parent]) {
			swap(&a[child], &a[parent]);
			parent = child;
			child = parent * 2 + 1;
		}
		else {
			break;
		}
	}
}
void HeapCreate(Heap* hp, HPDataType* a, int n) {
	hp->_size = 0;
	hp->_capacity = 0;
	hp->_a = NULL;
	for (int i = 0; i < n; i++) {
		HeapPush(hp, a[i]);
	}



}
void HeapDeatory(Heap* hp) {
	assert(hp);
	free(hp->_a);
	hp->_a = NULL;
	hp->_capacity = hp->_size = 0;
}
void AdjustUp(HPDataType* a, int child) {
	int parent = (child - 1) / 2;
	while (child > 0) {
		if (a[child] > a[parent]) {
			/*HPDataType tmp = a[child];
			a[child] = a[parent];
			a[parent] = tmp;
			child = parent;*/
			swap(&a[child], &a[parent]);
			parent = (child - 1) / 2;
		}
		else {
			break;
		}
	}
}
void HeapPush(Heap* hp, HPDataType x) {
	assert(hp);
	if (hp->_size == hp->_capacity) {
		int newcapacity = hp->_capacity == 0 ? 4 : hp->_capacity * 2;
		HPDataType* tmp = (HPDataType*)realloc(hp->_a, sizeof(HPDataType) * newcapacity);
		if (tmp == NULL) {
			perror("relloc fail");
			return;
		}
		hp->_a = tmp;
		hp->_capacity = newcapacity;
	}
	hp->_a[hp->_size] = x;
	hp->_size++;
	AdjustUp(hp->_a, hp->_size - 1);
}
// 堆的删除
void HeapPop(Heap* hp) {
	assert(hp);
	assert(!HeapEmpty(hp));
	swap(&hp->_a[0], &hp->_a[hp->_size - 1]);
	hp->_size--;
	Adjustdown(hp->_a, hp->_size, 0);
}
// 取堆顶的数据
HPDataType HeapTop(Heap* hp) {
	assert(hp);
	assert(!HeapEmpty(hp));
	return hp->_a[0];
}
// 堆的数据个数
int HeapSize(Heap* hp) {
	assert(hp);
	assert(!HeapEmpty(hp));
	return hp->_size;
}
// 堆的判空
int HeapEmpty(Heap* hp) {
	assert(hp);
	return hp->_size == 0;
}

4. 二叉树链式结构的实现

4.1 一颗简单的二叉树的实现
cpp 复制代码
typedef int BTDataType;
typedef struct BinaryTreeNode
{
    BTDataType _data;
    struct BinaryTreeNode* _left;
    struct BinaryTreeNode* _right;
}BTNode;
BTNode* CreatBinaryTree()
{
    BTNode* node1 = BuyNode(1);
    BTNode* node2 = BuyNode(2);
    BTNode* node3 = BuyNode(3);
    BTNode* node4 = BuyNode(4);
    BTNode* node5 = BuyNode(5);
    BTNode* node6 = BuyNode(6);

    node1->_left = node2;
    node1->_right = node4;
    node2->_left = node3;
    node4->_left = node5;
    node4->_right = node6;
    return node1;
}
4.2 二叉树的遍历

4.2.1 前序、中序以及后序遍历

学习二叉树结构，最简单的方式就是遍历。所谓二叉树遍历(Traversal)是按照某种特定的规则，依次对二叉树中的节点进行相应的操作，并且每个节点只操作一次。访问结点所做的操作依赖于具体的应用问题。遍历是二叉树上最重要的运算之一，也是二叉树上进行其它运算的基础

按照规则，二叉树的遍历有：前序/中序/后序的递归结构遍历：

前序遍历(Preorder Traversal 亦称先序遍历)------访问根结点的操作发生在遍历其左右子树之前。

中序遍历(Inorder Traversal)------访问根结点的操作发生在遍历其左右子树之中（间）。

后序遍历(Postorder Traversal)------访问根结点的操作发生在遍历其左右子树之后。

由于被访问的结点必是某子树的根，所以N(Node）、L(Left subtree）和R(Right subtree）又可解释为根、根的左子树和根的右子树。NLR、LNR和LRN分别又称为先根遍历、中根遍历和后根遍历。
cpp 复制代码
// 二叉树前序遍历
void BinaryTreePrevOrder(BTNode* root) {
    if (root == NULL) {
        return;
    }
    printf("%c ", root->_data);
    BinaryTreePrevOrder(root->_left);
    BinaryTreePrevOrder(root->_right);
}

// 二叉树中序遍历
void BinaryTreeInOrder(BTNode* root) {
    if (root == NULL) {
        return;
    }
    BinaryTreeInOrder(root->_left);
    printf("%c ", root->_data);
    BinaryTreeInOrder(root->_right);
}

// 二叉树后序遍历
void BinaryTreePostOrder(BTNode* root) {
    if (root == NULL) {
        return;
    }
    BinaryTreePostOrder(root->_left);
    BinaryTreePostOrder(root->_right);
    printf("%c ", root->_data);
}
前序遍历图解

4.2.2 层序遍历

层序遍历：除了先序遍历、中序遍历、后序遍历外，还可以对二叉树进行层序遍历。设二叉树的根节点所在层数为1，层序遍历就是从所在二叉树的根节点出发，首先访问第一层的树根节点，然后从左到右访问第2层上的节点，接着是第三层的节点，以此类推，自上而下，自左至右逐层访问树的结点的过程就是层序遍历。
cpp 复制代码
// 层序遍历
void PrintLevel(BTNode* root, int k) {
    if (root == NULL || k < 1) {
        return;
    }
    if (k == 1) {
        printf("%c ", root->_data);
    }
    else {
        PrintLevel(root->_left, k - 1);
        PrintLevel(root->_right, k - 1);
    }
}
4.3 结点的个数和高度等
cpp 复制代码
// 二叉树节点个数
int BinaryTreeSize(BTNode* root) {
    if (root == NULL) {
        return 0;
    }
    return 1 + BinaryTreeSize(root->_left) + BinaryTreeSize(root->_right);
}

// 二叉树叶子节点个数
int BinaryTreeLeafSize(BTNode* root) {
    if (root == NULL) {
        return 0;
    }
    if (root->_left == NULL && root->_right == NULL) {
        return 1;
    }
    return BinaryTreeLeafSize(root->_left) + BinaryTreeLeafSize(root->_right);
}

// 二叉树第k层节点个数
int BinaryTreeLevelKSize(BTNode* root, int k) {
    if (root == NULL || k < 1) {
        return 0;
    }
    if (k == 1) {
        return 1;
    }
    return BinaryTreeLevelKSize(root->_left, k - 1) + BinaryTreeLevelKSize(root->_right, k - 1);
}

// 二叉树查找值为x的节点
BTNode* BinaryTreeFind(BTNode* root, BTDataType x) {
    if (root == NULL) {
        return NULL;
    }
    if (root->_data == x) {
        return root;
    }
    BTNode* node = BinaryTreeFind(root->_left, x);
    if (node == NULL) {
        node = BinaryTreeFind(root->_right, x);
    }
    return node;
}
4.4 二叉树的创建和销毁
cpp 复制代码
// 通过前序遍历的数组"ABD##E#H##CF##G##"构建二叉树
BTNode* BinaryTreeCreate(BTDataType* a, int n, int* pi) {
    if (a == NULL || *pi >= n || a[*pi] == '#') {
        (*pi)++;
        return NULL;
    }

    BTNode* root = (BTNode*)malloc(sizeof(BTNode));
    if (root == NULL) {
        perror("malloc fail!");
    }
    root->_data = a[(*pi)++];
    root->_left = BinaryTreeCreate(a, n, pi);
    root->_right = BinaryTreeCreate(a, n, pi);
    return root;
}

// 二叉树销毁
void BinaryTreeDestory(BTNode** root) {
    if (*root == NULL) {
        return;
    }
    BinaryTreeDestory(&((*root)->_left));
    BinaryTreeDestory(&((*root)->_right));
    free(*root);
    *root = NULL;
}