数据结构--哈夫曼编码

  1. 基本概念

• 路径长度:从树中一个结点到另一个结点的分支数目。

• 树的路径长度:从根结点到树中所有叶结点的路径长度之和。

• 带权路径长度(WPL):设树有 n 个叶结点,每个叶结点带权值 w_i,从根到该叶结点的路径长度为 l_i,则 WPL=\sum_{i=1}^n w_i\times l_i。

• 哈夫曼树(最优二叉树):带权路径长度 最小 的二叉树,叶结点权值越大,离根结点越近。

  1. 哈夫曼树构造算法

  2. 初始化:将 n 个权值对应的结点,各自作为一棵仅含单个结点的二叉树,构成森林 F。

  3. 选择与合并:在 F 中选取 根结点权值最小的两棵二叉树,作为左右子树构造一棵新二叉树,新根结点权值为两棵子树根权值之和。

  4. 更新森林:从 F 中删除选中的两棵树,将新树加入 F。

  5. 重复步骤 2、3:直到 F 中仅含一棵二叉树,该树即为哈夫曼树。

关键特性:

• 初始 n 个叶结点,最终哈夫曼树的结点总数为 2n-1。

• 哈夫曼树中 没有度为 1 的结点。

  1. 哈夫曼编码

• 前缀编码:任意一个编码都不是另一个编码的前缀,保证解码无歧义。

• 哈夫曼编码构造:以字符出现频率为权值构建哈夫曼树,左分支标记 0,右分支标记 1,从根到叶结点的路径上的 0/1 序列,即为该叶结点对应字符的编码。

• 优势:频率高的字符编码短,频率低的字符编码长,实现数据压缩。

  1. 应用场景

• 数据压缩(如 Huffman 压缩算法)

• 通信编码优化

• 决策树模型构建

相关推荐
papership1 小时前
【入门级-数据结构-3、特殊树:完全二叉树的数组表示法】
数据结构·算法·链表
码途漫谈1 小时前
Easy-Vibe开发篇阅读笔记(四)——前端开发之结合 Agent Skills 美化界面
人工智能·笔记·ai·开源·ai编程
smj2302_796826521 小时前
解决leetcode第3911题.移除子数组元素后第k小偶数
数据结构·python·算法·leetcode
山甫aa1 小时前
差分数组 ----- 从零开始的数据结构
数据结构
早日退休!!!1 小时前
《数据结构选型指南》笔记
数据结构·数据库·oracle
丑八怪大丑2 小时前
Java数据结构与集合源码
数据结构
糖炒栗子03263 小时前
【笔记】高分卫星影像 TIF 切片处理
笔记
Nice_Fold4 小时前
Kubernetes DaemonSet、StatefulSet与Service(自用笔记)
笔记·容器·kubernetes
ZhiqianXia7 小时前
《The Design of Design》阅读笔记
前端·笔记·microsoft
祁白_7 小时前
nmap工具笔记整理
笔记·web安全·测试