求解哈夫曼树HuffmanTree以及C语言实现

哈夫曼树的实现思想是基于贪心算法。哈夫曼树的构建过程基于字符出现的频率或权重。在压缩数据时,出现频率较高的字符被编码为较短的二进制码,而出现频率较低的字符则被编码为较长的二进制码,以达到压缩数据的目的。
求解步骤: 创建一个优先队列(最小堆),用于存储待构建哈夫曼树的节点。对于每个字符,创建一个节点,并将该节点插入到优先队列中。节点的频率可以是字符在文本中出现的次数或者其他预定义的权重。从优先队列中提取出两个频率最小的节点作为左右子节点,并创建一个新节点作为它们的父节点。新节点的频率是左右子节点频率之和。将新节点插入优先队列中。重复上述操作,直到优先队列中只剩下一个节点,即根节点。

代码示例: Node表示哈夫曼树的节点,包含字符数据、频率和左右子节点指针;PriorityQueue表示优先队列,用于构建哈夫曼树,包含队列的大小、容量和节点指针数组。

c 复制代码
#include <stdio.h>
#include <stdlib.h>

// 定义哈夫曼树的节点结构
struct Node {
    char data;           // 节点存储的字符数据
    int freq;            // 节点对应字符的频率
    struct Node* left;   // 左子节点指针
    struct Node* right;  // 右子节点指针
};

// 定义优先队列结构,用于构建哈夫曼树
struct PriorityQueue {
    int size;               // 当前队列中的节点个数
    int capacity;           // 队列的最大容量
    struct Node** nodes;    // 节点指针数组
};

// 创建一个新的节点
struct Node* createNode(char data, int freq) {
    struct Node* node = (struct Node*)malloc(sizeof(struct Node));
    node->data = data;
    node->freq = freq;
    node->left = NULL;
    node->right = NULL;
    return node;
}

// 创建优先队列
struct PriorityQueue* createPriorityQueue(int capacity) {
    struct PriorityQueue* queue = (struct PriorityQueue*)malloc(sizeof(struct PriorityQueue));
    queue->size = 0;
    queue->capacity = capacity;
    queue->nodes = (struct Node**)malloc(capacity * sizeof(struct Node*));
    return queue;
}

// 交换两个节点的位置
void swap(struct Node** a, struct Node** b) {
    struct Node* temp = *a;
    *a = *b;
    *b = temp;
}

// 最小堆调整
void minHeapify(struct PriorityQueue* queue, int idx) {
    int smallest = idx;
    int left = 2 * idx + 1;
    int right = 2 * idx + 2;

    // 找到子节点中值最小的节点
    if (left < queue->size && queue->nodes[left]->freq < queue->nodes[smallest]->freq)
        smallest = left;

    if (right < queue->size && queue->nodes[right]->freq < queue->nodes[smallest]->freq)
        smallest = right;

    // 如果最小节点不是当前节点,则交换位置,并递归调整
    if (smallest != idx) {
        swap(&queue->nodes[idx], &queue->nodes[smallest]);
        minHeapify(queue, smallest);
    }
}

// 判断队列中是否只有一个节点
int isSizeOne(struct PriorityQueue* queue) {
    return queue->size == 1;
}

// 从队列中提取最小节点
struct Node* extractMin(struct PriorityQueue* queue) {
    struct Node* minNode = queue->nodes[0];
    queue->nodes[0] = queue->nodes[queue->size - 1];
    --queue->size;
    minHeapify(queue, 0);
    return minNode;
}

// 向队列中插入一个节点
void insert(struct PriorityQueue* queue, struct Node* node) {
    ++queue->size;
    int i = queue->size - 1;
    while (i && node->freq < queue->nodes[(i - 1) / 2]->freq) {
        queue->nodes[i] = queue->nodes[(i - 1) / 2];
        i = (i - 1) / 2;
    }
    queue->nodes[i] = node;
}

// 判断节点是否为叶节点
int isLeaf(struct Node* root) {
    return !(root->left) && !(root->right);
}

// 打印哈夫曼编码
void printCodes(struct Node* root, unsigned int code, unsigned int bitCount) {
    if (root) {
        // 如果是叶节点,则打印字符和对应的编码
        if (isLeaf(root)) {
            printf("%c: ", root->data);

            // 根据编码的位数逐位输出
            unsigned int mask = 1 << (bitCount - 1);
            while (mask) {
                if (code & mask)
                    printf("1");
                else
                    printf("0");
                mask >>= 1;
            }
            printf("\n");
        }

        // 递归打印左右子树的编码
        printCodes(root->left, code << 1, bitCount + 1);
        printCodes(root->right, (code << 1) | 1, bitCount + 1);
    }
    }

}

// 构建哈夫曼树
struct Node* buildHuffmanTree(char data[], int freq[], int size) {
    struct Node *left, *right, *top;
    struct PriorityQueue* queue = createPriorityQueue(size);

    // 将字符和频率作为节点插入优先队列
    for (int i = 0; i < size; ++i)
        insert(queue, createNode(data[i], freq[i]));

    // 从优先队列中取出两个最小频率的节点,合并成一个新节点
    // 直到队列中只剩下一个节点,即根节点
    while (!isSizeOne(queue)) {
        left = extractMin(queue);
        right = extractMin(queue);
        top = createNode('$', left->freq + right->freq);
        top->left = left;
        top->right = right;
        insert(queue, top);
    }

    return extractMin(queue);
}

// 打印哈夫曼编码
void huffmanCodes(char data[], int freq[], int size) {
    struct Node* root = buildHuffmanTree(data, freq, size);
    unsigned int code = 0;
    unsigned int bitCount = 0;
    printCodes(root, code, bitCount);
}

int main() {
    char data[] = { 'A', 'B', 'C', 'D', 'E' };
    int freq[] = { 5, 9, 12, 13, 16 };
    int size = sizeof(data) / sizeof(data[0]);

    huffmanCodes(data, freq, size);

    return 0;
}

最小堆是一种二叉树,其中每个节点的值都小于或等于其子节点的值。

相关推荐
qystca2 小时前
洛谷 B3637 最长上升子序列 C语言 记忆化搜索->‘正序‘dp
c语言·开发语言·算法
网易独家音乐人Mike Zhou8 小时前
【卡尔曼滤波】数据预测Prediction观测器的理论推导及应用 C语言、Python实现(Kalman Filter)
c语言·python·单片机·物联网·算法·嵌入式·iot
搬砖的小码农_Sky11 小时前
C语言:数组
c语言·数据结构
ahadee15 小时前
蓝桥杯每日真题 - 第19天
c语言·vscode·算法·蓝桥杯
Theliars15 小时前
C语言之字符串
c语言·开发语言
Reese_Cool15 小时前
【数据结构与算法】排序
java·c语言·开发语言·数据结构·c++·算法·排序算法
搬砖的小码农_Sky16 小时前
C语言:结构体
c语言·数据结构
平头哥在等你18 小时前
求一个3*3矩阵对角线元素之和
c语言·算法·矩阵
尹蓝锐18 小时前
C语言-11-18笔记
c语言
ahadee18 小时前
蓝桥杯每日真题 - 第18天
c语言·vscode·算法·蓝桥杯