数据结构--哈夫曼编码

  1. 基本概念

• 路径长度:从树中一个结点到另一个结点的分支数目。

• 树的路径长度:从根结点到树中所有叶结点的路径长度之和。

• 带权路径长度(WPL):设树有 n 个叶结点,每个叶结点带权值 w_i,从根到该叶结点的路径长度为 l_i,则 WPL=\sum_{i=1}^n w_i\times l_i。

• 哈夫曼树(最优二叉树):带权路径长度 最小 的二叉树,叶结点权值越大,离根结点越近。

  1. 哈夫曼树构造算法

  2. 初始化:将 n 个权值对应的结点,各自作为一棵仅含单个结点的二叉树,构成森林 F。

  3. 选择与合并:在 F 中选取 根结点权值最小的两棵二叉树,作为左右子树构造一棵新二叉树,新根结点权值为两棵子树根权值之和。

  4. 更新森林:从 F 中删除选中的两棵树,将新树加入 F。

  5. 重复步骤 2、3:直到 F 中仅含一棵二叉树,该树即为哈夫曼树。

关键特性:

• 初始 n 个叶结点,最终哈夫曼树的结点总数为 2n-1。

• 哈夫曼树中 没有度为 1 的结点。

  1. 哈夫曼编码

• 前缀编码:任意一个编码都不是另一个编码的前缀,保证解码无歧义。

• 哈夫曼编码构造:以字符出现频率为权值构建哈夫曼树,左分支标记 0,右分支标记 1,从根到叶结点的路径上的 0/1 序列,即为该叶结点对应字符的编码。

• 优势:频率高的字符编码短,频率低的字符编码长,实现数据压缩。

  1. 应用场景

• 数据压缩(如 Huffman 压缩算法)

• 通信编码优化

• 决策树模型构建

相关推荐
CSharp精选营1 天前
关系型 vs 非关系型:从原理到选型,一文搞定数据库核心分类
数据结构·nosql·关系型数据库·非关系型数据库·技术选型
RainCity2 天前
Java Swing 自定义组件库分享(十二)
java·笔记·后端
刘马想放假4 天前
Modbus 全栈技术解析:TCP、RTU、ASCII、RTU over TCP
数据结构·网络协议
北域码匠5 天前
冒泡排序太慢?鸡尾酒排序双向优化,原生 C# 零第三方库完整代码
数据结构·排序算法·泛型·c# 算法·鸡尾酒排序·原生 c# 开发·冒泡排序优化·嵌入式算法
LinXunFeng9 天前
Obsidian - 使用 Share Note 分享笔记并自部署
前端·笔记·github
Darling噜啦啦12 天前
列表转树算法深度解析:从 Map 到 Reduce 的两种实现,面试高频考点
数据结构·算法·面试
小小工匠13 天前
Redis - 事务机制:能实现 ACID 属性吗
数据结构·redis·性能优化·并发·持久化
玖玥拾13 天前
C/C++ 数据结构(七)栈、容器适配器
c语言·数据结构·c++··容器适配器
闪闪发亮的小星星13 天前
高斯光以及高斯光公式解释
笔记
cqbzcsq13 天前
CellFlow虚拟细胞论文阅读
论文阅读·人工智能·笔记·学习·生物信息