#POJ1521#Huffman编码

来源:互联网 发布:魔兽世界数据库wlk 编辑:程序博客网 时间:2024/05/17 09:37

 [POJ1521]Huffman编码

时间限制: 1 Sec  内存限制: 128 MB

题目描述

输入一个字符串,长度不超过100,仅由大写字母和下划线分组成。求用最好的字符编码方式,令总长度最小。

输入

多组数据,每组数据在一行上输入一个字符串,格式如前所述
当遇到END时,表示输入结束。

输出

对应每个输入,在一行上输出3个信息:首先是每个字母按固定长度8bit编码,字符串的总长度,然后是按最优编码的总长度,最后是前者对后者的比率,保留1位小数。

样例输入

AAAAABCDTHE_CAT_IN_THE_HATEND

样例输出

64 13 4.9144 51 2.8
【解】:
1,每个字母有固定长度8bit,则有字符串总长度为有效字符数*8。
2,以字符在字符串中出现的次数为权值,每次选择其中权值最小的两个节点生成一个新的节点建树。
3,[ 高亮 ! ]因为本题只要求最优编码的总长度(即在建成的huffman树中扫描字符,字符所在叶子节点的深度即为当前字符的编码长度,将所有字符编码长度相加),并未要求打印出编码,所以并不需要建树来扫描字符寻找深度,直接用优先队列将所有的字符出现次数进行运算即可。
4,注意所开数组大小必须保证能够容纳输入范围内的ascii码值,否则将溢出。

#include<cstdio>#include<iostream>#include<cstring>#include<queue>using namespace std;char s[150];int k[100];priority_queue<int,vector<int>,greater<int> >que;//小根堆:权值从小到大int main(){int n,i,a,b,sum;while(scanf("%s",s)){if(!strcmp(s,"END"))break;sum=0;n=strlen(s);printf("%d ",8*n);for(i=0;i<n;i++)//计算出现次数k[s[i]]++;for(i=0;i<100;i++)//进队if(k[i]){que.push(k[i]);k[i]=0;//还原}while(que.size()>1){//权值计算,注意队列中最后生成一个根时,已经计算完毕,此时应马上退出a=que.top();que.pop();b=que.top();que.pop();sum+=a+b;que.push(a+b);}que.pop();if(sum==0)sum=n;//特殊情况:只有一个字符时printf("%d %.1lf\n",sum,double(n*8)/sum);memset(s,'\0',sizeof(s));//memset(k,0,sizeof(k));此处因为前方22行已经还原,则不再清零。}}


0 0
原创粉丝点击