7.7 赫夫曼树应用解析（叶子到根逆向求每个字符的赫夫曼编码）

来源：互联网发布：网络运营推广岗位职责编辑：程序博客网时间：2024/05/17 01:52

赫夫曼树(Huffman)：又称最优树，是一类带权路径长度最短的树。带权路径长度最小的二叉树称作

最优二叉树或赫夫曼树。

带权路径的计算：记做WPL是路径长度和节点上权的乘积。

构造赫夫曼树(四步骤)：

1、n个权值{w1, w2,w3,…..wn}构造n棵二叉树的集合F{T1, T2, T3,…..Tn}，其中每棵二叉树Ti中只有一个带权的根节点Wi，其左右子树均未空。

2、在F中选取两棵根结点的权值最小的树作为左右子树构造一棵新的二叉树，且置新的二叉树的根节点的权值为其左、右子树上根结点的权值之和。

3、在F中删除这两棵树，同时将得到的二叉树加入F中。

4、重复（2）、（3），直到F中只含一棵树为止，这便是赫夫曼树。

注意点：

赫夫曼树中没有度为1的结点，一棵有n个子结点的赫夫曼树公有2n-1个结点。可以存储在一个大小为2n-1的一维数组中。

在构成赫夫曼树之后，力求编码从叶子结点出发走一条叶子到根的路径；

而译码从根出发走一条从根到叶子的路径。则对每个结点来说，既需知道双亲的信息，又需知道孩子的信息。

下面程序：

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163

/***********************************************************/
// 程序名称：HuffmanTree.cpp
// 程序目的：设计一个叶子到根逆向求每个字符的赫夫曼编码的程序
// 程序来源：数据结构与算法分析(C语言描述) P-147
// 日期：2013-8-26 21:22:19
/***********************************************************/
#include <stdio.h>
#include <stdlib.h>
#include <limits.h>
#include <string.h>

#define Error( str )        FatalError( str )
#define FatalError( str )   fprintf( stderr, "%s\n", str ), exit( 1 )

typedef int ElementType;
#define MAXQUEUE 10

typedef struct huffmantree
{
    unsigned int weight;    // 权值
    unsigned int parent, lchild, rchild;
} HTNode, *HuffmanTree;     // 动态分配数组存储赫夫曼树
typedef char* *HuffmanCode; // 动态分配数组存储赫夫曼编码表

int Min(HuffmanTree t, int i);
void Select(HuffmanTree t, int i, int &s1, int &s2);
void HuffmanTreeCoding(HuffmanTree &HT, HuffmanCode &HC, int *w, int n);

/************************************************************************/
// 主程序
/************************************************************************/
int main(void)
{
    HuffmanTree HT;
    HuffmanCode HC;

    int n;
    printf("请输入权值的个数(大于1): ");
    scanf("%d", &n);

    int* w;
    w = (int*)malloc(n * sizeof(int));
    printf("请输入%d个权值的(整型)： \n", n);
    for (int i=0; i <= n-1; i++)
        scanf("%d", w+i);

    HuffmanTreeCoding(HT, HC, w, n);

    for (int i=1; i <=n; i++)
        puts(HC[i]);

    return 0;
}

/************************************************************************/
// 获得totalNode个结点中权值最小的结点的序号
/************************************************************************/
int Min(HuffmanTree t, int totalNodes)
{   // 返回totalNodes个结点中权值最小的根结点序号
    int minIndex = 0;
    unsigned int unWeight = UINT_MAX;   // 无符号整型最大值
    for (int i=1; i <= totalNodes; i++)
    {
        if (t[i].weight < unWeight && t[i].parent == 0)     // t[i]为根结点
        {
            unWeight = t[i].weight;
            minIndex = i;
        }
    }
    t[minIndex].parent = 1;     // 给选中的根节点双亲赋1，避免第2次查找改点

    return minIndex;
}

/************************************************************************/
// 选择权值最小的树的根结点的序号
/************************************************************************/
void Select(HuffmanTree t, int minIndex, int &minIndex1, int &minIndex2)
{
    minIndex1 = Min(t, minIndex);
    minIndex2 = Min(t, minIndex);

    int tempIndex;
    if (minIndex1 > minIndex2)
    {
        tempIndex = minIndex1;
        minIndex1 = minIndex2;
        minIndex2 = tempIndex;
    }

    return;
}

/************************************************************************/
// 求解赫夫曼编码
/************************************************************************/
void HuffmanTreeCoding(HuffmanTree &HT, HuffmanCode &HC, int* w, int n)
{ // w存放n个字符的权值(均>0), 构造赫夫曼树，求出n个字符的赫夫曼编码HC
    if (n <= 1)
        return;

    int nNodes;     // 总结点和
    int nodeIndex;  // 根结点序号
    nNodes =  2 * n - 1;

    HT = (HuffmanTree)malloc( sizeof(HTNode) * (nNodes+1) );        // 0号单元未用

    HuffmanTree pTree;
    pTree = HT+1;
    for (nodeIndex=1; nodeIndex <= n; ++nodeIndex,++pTree, ++w)
    {
        pTree->weight = *w;
        pTree->parent = 0;
        pTree->lchild = 0;
        pTree->rchild = 0;
    }

    for ( ; nodeIndex <= nNodes; ++nodeIndex, ++pTree)
        (*pTree).parent = 0;

    // 创建赫夫曼树
    int minIndex1, minIndex2;
    for (nodeIndex = n+1; nodeIndex <= nNodes; nodeIndex++) // 循环n-1次
    { // 在HT[1~nodeIndexs-1]中选择parent为0且weight最小的两个结点，其序号分别为minIndex1,minIndex2
        Select(HT, nodeIndex-1, minIndex1, minIndex2);
        HT[minIndex1].parent = HT[minIndex2].parent = nodeIndex;
        HT[nodeIndex].lchild = minIndex1;
        HT[nodeIndex].rchild = minIndex2;
        HT[nodeIndex].weight = HT[minIndex1].weight + HT[minIndex2].weight;
    }

    // 从叶子到根逆向求每个字符的赫夫曼编码
    HC = (HuffmanCode)malloc( (n+1)*sizeof(char*));

    // 分配n个字符编码的头指针向量([0]不用)
    char* codingSize;
    codingSize = (char*)malloc(sizeof(char) * n);   // 分配求编码的工作空间
    codingSize[n-1] = '\0';     // 编码结束符

    for (nodeIndex = 1; nodeIndex <= n; nodeIndex++)
    { // 逐个字符求赫夫曼编码
        int pos;
        unsigned int c, f;
        pos = n - 1;        // 编码结束位置

        for (c=nodeIndex, f=HT[nodeIndex].parent; f != 0; c=f, f = HT[f].parent)
        {   // 从叶子到根逆向求编码
            if (HT[f].lchild == c)
                codingSize[--pos] = '0';
            else
                codingSize[--pos] = '1';

            HC[nodeIndex] = (char*)malloc((n - pos) * sizeof(char));
            // 为第i个字符编码分配空间
            strcpy(HC[nodeIndex], &codingSize[pos]);  // 从codingSize复制编码串到HC
        }
    }

    free(codingSize);   // 释放工作区间

    return;
}

输出结果：