数据结构实验之二叉树六:哈夫曼编码

来源:互联网 发布:全球经济指标数据网 编辑:程序博客网 时间:2024/06/14 19:08

数据结构实验之二叉树六:哈夫曼编码

Time Limit: 1000MS Memory Limit: 65536KB
Submit Statistic

Problem Description

字符的编码方式有多种,除了大家熟悉的ASCII编码,哈夫曼编码(Huffman Coding)也是一种编码方式,它是可变字长编码。该方法完全依据字符出现概率来构造出平均长度最短的编码,称之为最优编码。哈夫曼编码常被用于数据文件压缩中,其压缩率通常在20%90%之间。你的任务是对从键盘输入的一个字符串求出它的ASCII编码长度和哈夫曼编码长度的比值。

Input

 输入数据有多组,每组数据一行,表示要编码的字符串。

Output

 对应字符的ASCII编码长度lahuffman编码长度lhla/lh的值(保留一位小数),数据之间以空格间隔。

Example Input

AAAAABCDTHE_CAT_IN_THE_HAT

Example Output

64 13 4.9144 51 2.8

Hint

 

Author



先说一下哈夫曼编码:

设某信源产生有五种符号u1、u2、u3、u4和u5,对应概率P1=0.4,P2=0.1,P3=P4=0.2,P5=0.1。首先,将符号按照概率由大到小排队,编码时,从最小概率的两个符号开始,可选其中一个支路为0,另一支路为1。这里,我们选上支路为0,下支路为1。再将已编码的两支路的概率合并,并重新排队。多次重复使用上述方法直至合并概率归一时为止。可能出现两者虽平均码长相等,但同一符号可以有不同的码长,即编码方法并不唯一,其原因是两支路概率合并后重新排队时,可能出现几个支路概率相等,造成排队方法不唯一。一般,若将新合并后的支路排到等概率的最上支路,将有利于缩短码长方差,且编出的码更接近于等长码。
简单来说在此题的理解中就是把给定的字符串中的ASCII码中的编号出现的频率按照从小到大的顺序排列,然后每次从其中挑出两个最小的相加,然后放入继续排序,这两个数的和暂存下来,每次都加上新产生最小的和,最后的结果就是所求的编码。详见百度文库:点击打开链接

这个题最简单的就是用STL优先队列来做,由于平时的测试不能用STL的固定模板,所以手写了一个数组+快排模拟的优先队列

#include <iostream>#include <string.h>#include <stdio.h>using namespace std;void qsort(int a[], int low, int high)  //从小到大快排{    int x = a[low], i = low, j = high;    if(low >= high)        return;    while(i < j)    {        if(i < j && a[j] >= x)            j--;        a[i] = a[j];        if(i < j && a[i] <= x)            i++;        a[j] = a[i];    }    a[i] = x;    qsort(a,low, i - 1);    qsort(a,i + 1, high);}int main(){    ios::sync_with_stdio(false);    char s[1000];    int t[500];                         //将字符串中的字符转化为ASCII码中的编号存入数组中,并且记录个数    int q[1000];    while(cin >> s)    {        int sum1, sum2 = 0;             //初始化        int top = 0, rear = 0;        memset(t, 0, sizeof(t));        //初始化t中默认值全为0        int len = strlen(s);        sum1 = 8 * len;                 //ASCII码每个字符占8个字节        for(int i = 0; i < len; i++)    //将字符按照ASCII码中的编号存入中间数组,会记录下出现的次数            t[s[i]]++;        for(int i = 0; i < 500; i++)        {            if(t[i] != 0)                q[top++] = t[i];        //将出现的次数放入队列中        }        qsort(q, 0, top- 1);            //对队列快排        while(top != rear)        {            int x1 = q[rear++];         //取出最小的两个也就是队列最开始两个,相加产生的新数据存入队列中然后快排            if(top != rear)             //直到结束            {                int x2 = q[rear++];                sum2 = sum2 + (x1 + x2);                q[top++] = x1 + x2;                qsort(q, rear, top - 1);            }        }        printf("%d %d %.1lf\n", sum1, sum2, 1.0 * sum1 / sum2);    }    return 0;}


阅读全文
0 0
原创粉丝点击