hdu 1053Entropy

来源:互联网 发布:手机淘宝申请售后 编辑:程序博客网 时间:2024/05/21 08:37
hdu 1053Entropy
给定一个字符串,计算ASCII编码的长度,和最优Huffman编码的长度,和它们的比率。
先统计每个字符出现的次数,当做每个节点的权值,按从小到大的顺序排序。先将所有单个字符看成一个只有根节点的树,每次选出根节点权值最小的两棵树,合并为一棵树,这棵树的根节点权值为选择的两棵树的根节点权值之和,选择n-1次之后就构成了一棵树,这棵树具有2*n-1个节点。
叶子节点代表每个字符,通向左子树的边标记为0,通向右子树的边标记为1,则从根节点到每个叶子节点的路径就代表这个字符的最优编码。可以根据这棵树求出每个字符的编码及其长度。
可以用数组来实现,记录每个节点的左右儿子节点和父亲节点。先按照权值将所有字符排序,然后,再在这个数组后边添加新创建的节点。设初始有n个节点,则以位置n分界,前后两序列的权值都是有序的(后创建的节点一定不小于先创建的节点权值),可以向归并排序那样,每次选出最小的再合并到数组的最后。在位置n处设置一个哨兵,可以方便实现。
代码如下:
/*************************************************************************> File Name: 1053.cpp> Author: gwq> Mail: gwq5210@qq.com > Created Time: 2014年10月10日 星期五 11时15分28秒 ************************************************************************/#include <cmath>#include <ctime>#include <cctype>#include <climits>#include <cstdio>#include <cstdlib>#include <cstring>#include <map>#include <set>#include <queue>#include <stack>#include <vector>#include <sstream>#include <iostream>#include <algorithm>#define INF (INT_MAX / 10)#define SQR(x) ((x) * (x))#define rep(i, n) for (int i = 0; i < (n); ++i)#define repf(i, a, b) for (int i = (a); i <= (b); ++i)#define repd(i, a, b) for (int i = (a); i >= (b); --i)#define clr(arr, val) memset(arr, val, sizeof(arr))#define pb push_back#define sz(a) ((int)(a).size())#define middle(x, y) ((x + y) >> 1)using namespace std;typedef set<int> si;typedef vector<int> vi;typedef map<int, int> mii;typedef long long ll;#define N 1010int w[N], lc[N], rc[N], parent[N];char str[N];int main(int argc, char *argv[]){while (scanf("%s", str) != EOF) {if (strcmp(str, "END") == 0) {break;}int len = strlen(str);clr(w, 0);clr(lc, -1);clr(rc, -1);clr(parent, -1);for (int i = 0; i < len; ++i) {int idx = (str[i] == '_') ? 26 : (str[i] - 'A');w[idx]++;}int cnt = 0;for (int i = 0; i < 27; ++i) {if (w[i] > 0) {w[cnt++] = w[i];}}//哨兵for (int i = cnt; i <= 2 * cnt; ++i) {w[i] = INF;}sort(w, w + cnt);int i = 0;int k = 0;//将cnt位置留出来当做哨兵int j = cnt + 1;int pos = cnt + 1;//选择cnt - 1次while (k < cnt - 1) {int l = -1;int r = -1;int weight = 0;if (w[i] < w[j]) {weight += w[i];l = i;++i;} else {weight += w[j];l = j;++j;}if (w[i] < w[j]) {weight += w[i];r = i;++i;} else {weight += w[j];r = j;++j;}w[pos] = weight;lc[pos] = l;rc[pos] = r;parent[l] = pos;parent[r] = pos;++pos;++k;}int tot = 0;for (int i = 0; i < cnt; ++i) {int length = 0;int p = parent[i];while (p != -1) {++length;p = parent[p];}tot += w[i] * length;}//当只有一种字符时if (cnt == 1) {tot = w[0];}printf("%d %d %.1f\n", len * 8, tot, len * 8.0 / tot);}return 0;}



0 0