数据结构--哈夫曼编码

  1. 基本概念

• 路径长度:从树中一个结点到另一个结点的分支数目。

• 树的路径长度:从根结点到树中所有叶结点的路径长度之和。

• 带权路径长度(WPL):设树有 n 个叶结点,每个叶结点带权值 w_i,从根到该叶结点的路径长度为 l_i,则 WPL=\sum_{i=1}^n w_i\times l_i。

• 哈夫曼树(最优二叉树):带权路径长度 最小 的二叉树,叶结点权值越大,离根结点越近。

  1. 哈夫曼树构造算法

  2. 初始化:将 n 个权值对应的结点,各自作为一棵仅含单个结点的二叉树,构成森林 F。

  3. 选择与合并:在 F 中选取 根结点权值最小的两棵二叉树,作为左右子树构造一棵新二叉树,新根结点权值为两棵子树根权值之和。

  4. 更新森林:从 F 中删除选中的两棵树,将新树加入 F。

  5. 重复步骤 2、3:直到 F 中仅含一棵二叉树,该树即为哈夫曼树。

关键特性:

• 初始 n 个叶结点,最终哈夫曼树的结点总数为 2n-1。

• 哈夫曼树中 没有度为 1 的结点。

  1. 哈夫曼编码

• 前缀编码:任意一个编码都不是另一个编码的前缀,保证解码无歧义。

• 哈夫曼编码构造:以字符出现频率为权值构建哈夫曼树,左分支标记 0,右分支标记 1,从根到叶结点的路径上的 0/1 序列,即为该叶结点对应字符的编码。

• 优势:频率高的字符编码短,频率低的字符编码长,实现数据压缩。

  1. 应用场景

• 数据压缩(如 Huffman 压缩算法)

• 通信编码优化

• 决策树模型构建

相关推荐
菩提小狗17 小时前
小迪安全2023-2024|第5天:基础入门-反弹SHELL&不回显带外&正反向连接&防火墙出入站&文件下载_笔记|web安全|渗透测试|
笔记·安全·web安全
Wentao Sun17 小时前
致敬软件创业者2026
笔记·程序人生
独好紫罗兰17 小时前
对python的再认识-基于数据结构进行-a003-列表-排序
开发语言·数据结构·python
wuhen_n17 小时前
JavaScript内置数据结构
开发语言·前端·javascript·数据结构
2401_8414956417 小时前
【LeetCode刷题】二叉树的层序遍历
数据结构·python·算法·leetcode·二叉树··队列
独好紫罗兰18 小时前
对python的再认识-基于数据结构进行-a002-列表-列表推导式
开发语言·数据结构·python
2401_8414956418 小时前
【LeetCode刷题】二叉树的直径
数据结构·python·算法·leetcode·二叉树··递归
深蓝海拓18 小时前
PySide6,QCoreApplication::aboutToQuit与QtQore.qAddPostRoutine:退出前后的清理工作
笔记·python·qt·学习·pyqt
数智工坊18 小时前
【数据结构-树与二叉树】4.5 线索二叉树
数据结构
酒鼎18 小时前
学习笔记(3)HTML5新特性(第2章)
笔记·学习·html5