数据结构：哈夫曼树

哈夫曼树（Huffman Tree）是一种用于数据压缩的二叉树，由大卫·哈夫曼（David A. Huffman）于1952年提出。它通过构建最优二叉树来实现数据的高效压缩，广泛应用于文件压缩、图像压缩等领域。

哈夫曼树的核心思想是用较短的编码表示出现频率较高的字符，用较长的编码表示出现频率较低的字符，从而减少整体的编码长度。

假设有以下字符及其频率：

构建哈夫曼树的过程：

将所有字符节点放入优先队列。
取出A(5)和B(9)，合并为新节点(14)，放回队列。
取出C(12)和D(13)，合并为新节点(25)，放回队列。
取出E(16)和新节点(14)，合并为新节点(30)，放回队列。
取出新节点(25)和F(45)，合并为新节点(70)，放回队列。
取出新节点(30)和新节点(70)，合并为根节点(100)。

复制代码

        (100)
       /     \
    (30)    (70)
   /   \    /   \
(14)  E(16) (25) F(45)
 /  \      /  \
A(5) B(9) C(12) D(13)

字符	权重（频率）	路径长度	权重 × 路径长度
A	5	3	5×3=15
B	9	3	9×3=27
C	12	3	12×3=36
D	13	3	13×3=39
E	16	2	16×2=32
F	45	2	45×2=90

WPL 总和：

15+27+36+39+32+90=239

路径长度是哈夫曼树中一个重要的概念，它直接决定了每个字符的编码长度。通过最小化带权路径长度（WPL），哈夫曼树能够实现数据的高效压缩。