数据结构—基础知识(15):哈夫曼树

数据结构---基础知识(15):哈夫曼树

哈夫曼树的基本概念

哈夫曼(Huffman)树又称最优树,是一类带权路径长度最短的树,在实际中有广泛的用途。哈夫曼树的定义,涉及路径、路径长度、权等概念,下面先给出这些概念的定义,然后再介绍哈夫曼树

  1. 路径:从树中一个结点到另一个结点之间的分支构成这两个结点之间的路径。
  2. 路径长度:路径上的分支数目称作路径长度。
  3. 树的路径长度:从树根到每一结点的路径长度之和。
  4. :赋予某个实体的一个量,是对实体的某个或某些属性的数值化描述。在数据结构中,实体有结点(元素)和边(关系)两大类,所以对应有结点权利边权结点权或边权具体代表什么意义,由具体情况决定。如果在一棵树中的结点上带有权值,则对应的就有带权树等概念。
  5. 结点的带权路径长度:从该结点到树根之间的路径长度与结点上权的乘积。
  6. 树的带权路径长度:树中所有叶子结点的带权路径长度之和,通常记作WPL。
  7. 哈夫曼树:设有m个权值{w1,w2,...wm},可以构造一棵含n个叶子结点的二叉树,每个叶子结点的权为w,则其中带权路径长度WPL最小的一叉树称做最优二叉树或哈夫曼树。

例如,下图中所示的3棵二叉树,都含4个叶子结点a、b、c、d,分别带权7、5、2、4,他们的带权路径长度分别为

哈夫曼树的构造算法

哈夫曼树的构造过程

  1. 根据给定的n个权值{w1,w₂,...,wn},构造n棵只有根结点的二叉树,这n棵二叉树构成一个森林F。
  2. 在森林F中选取两棵根结点的权值最小的树作为左右子树构造一棵新的二叉树,且置新的二叉树的根结点的权值为其左、右子树上根结点的权值之和。(选用两小造新树)
  3. 在森林F中删除这两棵树,同时将新得到的二叉树加人F中。(删除两小添新人)
  4. 重复(2)和(3),直到F只含一棵树为止。这棵树便是哈夫曼树。(重复(2)(3)剩单根)

在构造哈夫曼树时,首先选择权小的,这样保证权大的离根较近,这样一来,在计算树的带权路径长度时,自然会得到最小带权路径长度,这种生成算法是一种典型的贪心法。

注:哈夫曼树的结点的度数为0或2,没有度为1的结点。

哈夫曼算法的实现

c 复制代码
//-------哈夫曼树的存储表示-------
typedef struct{
    int weight;//结点的权值
    int parent,lchild,rchild;//结点的双亲、左孩子、右孩子的下标
}HTNode,*HuffmanTree;//动态分配数组存储哈夫曼树
权值 双亲 左孩子 右孩子
weight parent lchild rchild

包含n棵树的森林经过n-1次合并才能形成哈夫曼树,共产生n-1个新结点

算法:构造哈夫曼树

【算法步骤】

  1. 初始化:首先动态申请2n个单元;然后循环 2n-1次,从1号单元开始,依次将1至2n-1所有单元中的双亲、左孩子、右孩子的下标都初始化为0;最后再循环n次,输入前n个单元中叶子结点的权值。
  2. 创建树:循环n-1次,通过n-1次的选择、删除与合并来创建哈夫曼树。选择是从当前森林中选择双亲为0且权值最小的两个树根结点s1和 s2;删除是指将结点s1 和s2白的双亲改为非 0;合并就是将s1 和 s2的权值和作为一个新结点的权值依次存入到数组的第n+1之后的单元中,同时记录这个新结点左孩子的下标为s1,右孩子的下标为 s2。
c 复制代码
void CreateHuffmanTree(HuffmanTree &HT,int n)
{
    if(n<=1) return;
    m=2*n-1;
    HT=new HTNode[m+1];//0号单元未用,所以需要动态分配m+1个单元,HT[m]表示根结点
    for(i=1;i<=m,++1)//将1~m号单元中的双亲、左孩子,右孩子的下标都初始化为0
    {
        HT[i].parnt=0;HT[i].lchild=0;HT[i].rchild=0;
    }
    for(i=1;i<=n,++1)//输入前n个单元中叶子结点的权值
        cin>>HT[i].weight;
/*-----------初始化工作结束,下面开始创建哈夫曼树-----------*/
    for(i=n+1;i<=n;++1)
    {//通过n-1次的选择、删除、合并来创建哈夫曼树
        Select(HT,i-1,s1,s2);
        //在HT[k](1≤k≤i-1)中选择两个其双亲域0且权值最小的结点,并返回它们在HT中的序号s1和s2(最小结点下标)
        HT[s1].parent=i;HT[s2].parent=i;//修改HT[s1][s2]的parent值
        HT[i].lchild=s1;HT[i].rchild=s2;//s1,s2分别作为i的左右孩子
        HT[i].weight=HT[s1].weight+HT[s2].weight;//i的权值为左右孩子之和
    }
}

已知w=(5,29,7,8,14,23,3,11),构造一棵哈夫曼树,计算树的带权路径长度,并给出构造过程中存储结构HT的初始状态和终结状态。

HT初态
结点i weight parent lchild rchild
1 5 0 0 0
2 29 0 0 0
3 7 0 0 0
4 8 0 0 0
5 14 0 0 0
6 23 0 0 0
7 3 0 0 0
8 11 0 0 0
9 - 0 0 0
10 - 0 0 0
11 - 0 0 0
12 - 0 0 0
13 - 0 0 0
14 - 0 0 0
15 - 0 0 0
HT的终态
结点i weight parent lchild rchild
1 5 9 0 0
2 29 14 0 0
3 7 10 0 0
4 8 10 0 0
5 14 12 0 0
6 23 13 0 0
7 3 9 0 0
8 11 11 0 0
9 8 11 7 1
10 15 12 3 4
11 19 13 9 8
12 29 14 5 10
13 42 15 11 6
14 58 15 2 12
15 100 0 13 14

相关推荐
daily_23339 分钟前
数据结构——小小二叉树第三幕(链式结构的小拓展,二叉树的创建,深入理解二叉树的遍历)超详细!!!
数据结构·c++·算法
浦东新村轱天乐30 分钟前
神经网络反向传播算法公式推导
神经网络·算法·机器学习
SUN_Gyq42 分钟前
什么是 C++ 中的模板特化和偏特化? 如何进行模板特化和偏特化?
开发语言·c++·算法
码上一元1 小时前
【百日算法计划】:每日一题,见证成长(026)
算法
愿天垂怜1 小时前
【C++】C++11引入的新特性(1)
java·c语言·数据结构·c++·算法·rust·哈希算法
垂杨有暮鸦⊙_⊙1 小时前
阅读《先进引信技术的发展与展望》识别和控制部分_笔记
笔记·学习
淡写青春2091 小时前
计算机基础---进程间通信和线程间通信的方式
java·开发语言·数据结构
kitesxian1 小时前
Leetcode200. 岛屿数量(HOT100)
算法·深度优先
特种加菲猫1 小时前
初阶数据结构之栈的实现
开发语言·数据结构·笔记
LNTON羚通1 小时前
算法定制LiteAIServer视频智能分析平台工业排污检测算法智控环保监管
算法·目标检测·音视频·监控·视频监控