数据结构实验之二叉树六:哈夫曼编码

来源:互联网 发布:波黑战争 知乎 编辑:程序博客网 时间:2024/06/05 20:07

Problem Description

字符的编码方式有多种,除了大家熟悉的ASCII编码,哈夫曼编码(Huffman Coding)也是一种编码方式,它是可变字长编码。该方法完全依据字符出现概率来构造出平均长度最短的编码,称之为最优编码。哈夫曼编码常被用于数据文件压缩中,其压缩率通常在20%90%之间。你的任务是对从键盘输入的一个字符串求出它的ASCII编码长度和哈夫曼编码长度的比值。

Input

 输入数据有多组,每组数据一行,表示要编码的字符串。

Output

 对应字符的ASCII编码长度lahuffman编码长度lhla/lh的值(保留一位小数),数据之间以空格间隔。

Example Input

AAAAABCDTHE_CAT_IN_THE_HAT

Example Output

64 13 4.9144 51 2.8

code:

#include <iostream>
#include <cstdio>
#include <cstring>
using namespace std;
void qsort(int a[], int l, int r)
{
    int x = a[l];
    int i = l, j = r;
    if(l>=r) return;
    while(i<j)
    {
        if(i<j&&a[j]>=x) j--;
        a[i] = a[j];
        if(i<j&&a[i]<=x) i++;
        a[j] = a[i];
    }
    a[i] = x;
    qsort(a, l, i-1);
    qsort(a, i+1, r);
}
int main()
{
    char s[1000];
    int t[500];
    int q[1000];
    while(~scanf("%s", s))
    {
        int sum1, sum2 = 0;
        int top = 0, rear = 0;
        memset(t, 0, sizeof(t));
        int len = strlen(s);
        sum1 = 8*len;
        for(int i = 0;i<len;i++)
        {
            t[s[i]]++;
        }
        for(int i = 0;i<500;i++)
        {
            if(t[i]!=0) q[top++] = t[i];
        }
        qsort(q, 0, top-1);
        while(top!=rear)
        {
            int x1 = q[rear++];
            if(top!=rear)
            {
                int x2 = q[rear++];
                sum2 += (x1+x2);
                q[top++] = x1+x2;
                qsort(q, rear, top-1);
            }
        }
        printf("%d %d %.1lf\n", sum1, sum2, 1.0*sum1/sum2);
    }
}
阅读全文
0 0
原创粉丝点击