数据结构--哈夫曼编码

  1. 基本概念

• 路径长度:从树中一个结点到另一个结点的分支数目。

• 树的路径长度:从根结点到树中所有叶结点的路径长度之和。

• 带权路径长度(WPL):设树有 n 个叶结点,每个叶结点带权值 w_i,从根到该叶结点的路径长度为 l_i,则 WPL=\sum_{i=1}^n w_i\times l_i。

• 哈夫曼树(最优二叉树):带权路径长度 最小 的二叉树,叶结点权值越大,离根结点越近。

  1. 哈夫曼树构造算法

  2. 初始化:将 n 个权值对应的结点,各自作为一棵仅含单个结点的二叉树,构成森林 F。

  3. 选择与合并:在 F 中选取 根结点权值最小的两棵二叉树,作为左右子树构造一棵新二叉树,新根结点权值为两棵子树根权值之和。

  4. 更新森林:从 F 中删除选中的两棵树,将新树加入 F。

  5. 重复步骤 2、3:直到 F 中仅含一棵二叉树,该树即为哈夫曼树。

关键特性:

• 初始 n 个叶结点,最终哈夫曼树的结点总数为 2n-1。

• 哈夫曼树中 没有度为 1 的结点。

  1. 哈夫曼编码

• 前缀编码:任意一个编码都不是另一个编码的前缀,保证解码无歧义。

• 哈夫曼编码构造:以字符出现频率为权值构建哈夫曼树,左分支标记 0,右分支标记 1,从根到叶结点的路径上的 0/1 序列,即为该叶结点对应字符的编码。

• 优势:频率高的字符编码短,频率低的字符编码长,实现数据压缩。

  1. 应用场景

• 数据压缩(如 Huffman 压缩算法)

• 通信编码优化

• 决策树模型构建

相关推荐
仰泳的熊猫3 小时前
题目2570:蓝桥杯2020年第十一届省赛真题-成绩分析
数据结构·c++·算法·蓝桥杯
罗超驿7 小时前
独立实现双向链表_LinkedList
java·数据结构·链表·linkedlist
左左右右左右摇晃9 小时前
计算机网络笔记整理
笔记·计算机网络
不吃西红柿的859 小时前
[职场] 内容运营求职简历范文 #笔记#职场发展
笔记·职场和发展·内容运营
努力也学不会java9 小时前
【缓存算法】一篇文章带你彻底搞懂面试高频题LRU/LFU
java·数据结构·人工智能·算法·缓存·面试
似水明俊德9 小时前
02-C#.Net-反射-学习笔记
开发语言·笔记·学习·c#·.net
智者知已应修善业10 小时前
【51单片机独立按键控制数码管移动反向,2片74CH573/74CH273段和位,按键按下保持原状态】2023-3-25
经验分享·笔记·单片机·嵌入式硬件·算法·51单片机
C羊驼10 小时前
C语言:两天打鱼,三天晒网
c语言·经验分享·笔记·算法·青少年编程
sheeta199810 小时前
苍穹外卖Day04笔记
笔记
菜菜小狗的学习笔记11 小时前
剑指Offer算法题(四)链表
数据结构·算法·链表