数据结构--哈夫曼编码

客梦2025-12-26 8:20

• 路径长度：从树中一个结点到另一个结点的分支数目。

• 树的路径长度：从根结点到树中所有叶结点的路径长度之和。

• 带权路径长度（WPL）：设树有 n 个叶结点，每个叶结点带权值 w_i，从根到该叶结点的路径长度为 l_i，则 WPL=\sum_{i=1}^n w_i\times l_i。

• 哈夫曼树（最优二叉树）：带权路径长度最小的二叉树，叶结点权值越大，离根结点越近。

关键特性：

• 初始 n 个叶结点，最终哈夫曼树的结点总数为 2n-1。

• 哈夫曼树中没有度为 1 的结点。

• 前缀编码：任意一个编码都不是另一个编码的前缀，保证解码无歧义。

• 哈夫曼编码构造：以字符出现频率为权值构建哈夫曼树，左分支标记 0，右分支标记 1，从根到叶结点的路径上的 0/1 序列，即为该叶结点对应字符的编码。

• 优势：频率高的字符编码短，频率低的字符编码长，实现数据压缩。

• 数据压缩（如 Huffman 压缩算法）

• 通信编码优化

• 决策树模型构建