#POJ1521#Huffman编码

来源：互联网发布：魔兽世界数据库wlk 编辑：程序博客网时间：2024/05/17 09:37

[POJ1521]Huffman编码

时间限制: 1 Sec 内存限制: 128 MB

题目描述

输入一个字符串，长度不超过100，仅由大写字母和下划线分组成。求用最好的字符编码方式，令总长度最小。

输入

多组数据，每组数据在一行上输入一个字符串，格式如前所述

当遇到END时，表示输入结束。

输出

对应每个输入，在一行上输出3个信息：首先是每个字母按固定长度8bit编码，字符串的总长度，然后是按最优编码的总长度，最后是前者对后者的比率，保留1位小数。

样例输入

AAAAABCDTHE_CAT_IN_THE_HATEND

样例输出

64 13 4.9144 51 2.8

【解】：

1,每个字母有固定长度8bit,则有字符串总长度为有效字符数*8。

2,以字符在字符串中出现的次数为权值，每次选择其中权值最小的两个节点生成一个新的节点建树。

3,[ 高亮 ! ]因为本题只要求最优编码的总长度(即在建成的huffman树中扫描字符，字符所在叶子节点的深度即为当前字符的编码长度，将所有字符编码长度相加)，并未要求打印出编码，所以并不需要建树来扫描字符寻找深度，直接用优先队列将所有的字符出现次数进行运算即可。

4,注意所开数组大小必须保证能够容纳输入范围内的ascii码值,否则将溢出。

#include<cstdio>#include<iostream>#include<cstring>#include<queue>using namespace std;char s[150];int k[100];priority_queue<int,vector<int>,greater<int> >que;//小根堆：权值从小到大int main(){int n,i,a,b,sum;while(scanf("%s",s)){if(!strcmp(s,"END"))break;sum=0;n=strlen(s);printf("%d ",8*n);for(i=0;i<n;i++)//计算出现次数k[s[i]]++;for(i=0;i<100;i++)//进队if(k[i]){que.push(k[i]);k[i]=0;//还原}while(que.size()>1){//权值计算，注意队列中最后生成一个根时，已经计算完毕，此时应马上退出a=que.top();que.pop();b=que.top();que.pop();sum+=a+b;que.push(a+b);}que.pop();if(sum==0)sum=n;//特殊情况：只有一个字符时printf("%d %.1lf\n",sum,double(n*8)/sum);memset(s,'\0',sizeof(s));//memset(k,0,sizeof(k));此处因为前方22行已经还原，则不再清零。}}

0 0