【NOI2015 Day2】荷马史诗 huffman tree结构运用

来源:互联网 发布:经传软件指标全集 编辑:程序博客网 时间:2024/04/30 15:43

Huffman tree
先来看一下定义:

给定n个权值作为n个叶子结点,构造一棵二叉树,若带权路径长度达到最小,称这样的二叉树为最优二叉树,也称为哈夫曼树(Huffman
Tree)。哈夫曼树是带权路径长度最短的树,权值较大的结点离根较近。——百度百科

Huffman tree有以下特性:
1.仅有叶子节点带权值,若有n个叶子节点,则总节点数为2n-1;
2.对于同一组权值来说,Huffman tree可以有不同的组成方案;
3.权值较大的节点离root越近,那么权值越小的就越远。
4.结点的带权路径长度为:从根结点到该结点之间的路径长度与该结点的权的乘积。
5.树的带权路径长度规定为所有叶子结点的带权路径长度之和,记为WPL。

Huffman tree的构造:
曾经有道题叫[合并果子],构造Huffman tree的方法与其类似;
第一步:把所有带权值的叶子节点看做n个独木桩森林;
第二步:从所有节点中拿出两个权值最小的,合并为一颗新树,新树左右儿子即为两个权值,根为权值之和;
第三步:将新树放回森林,再重复第二步,直到最后只剩一颗树即为Huffman tree。

用画图乱画一下过程:
乱画的

好的下面我们来看题:
问题描述:

追逐影子的人,自己就是影子。 ——荷马

Allison 最近迷上了文学。她喜欢在一个慵懒的午后,细细地品上一杯卡布奇诺,静静地阅读她爱不释手的《荷马史诗》。但是由《奥德赛》和《伊利亚特》组成的鸿篇巨制《荷马史诗》实在是太长了,Allison 想通过一种编码方式使得它变得短一些。一部《荷马史诗》中有 n 种不同的单词,从 1 到 n 进行编号。其中第 i 种单词出现的总次数为 wi。Allison 想要用 k 进制串 si 来替换第 i 种单词,使得其满足如下要求:对于任意的 1≤i,j≤n,i≠j,都有:si 不是 sj 的前缀。现在 Allison 想要知道,如何选择 si,才能使替换以后得到的新的《荷马史诗》长度最小。在确保总长度最小的情况下,Allison 还想知道最长的 si 的最短长度是多少?一个字符串被称为 k 进制字符串,当且仅当它的每个字符是 0 到 k−1 之间(包括 0 和 k−1)的整数。字符串 Str1 被称为字符串 Str2 的前缀,当且仅当:存在 1≤t≤m,使得 Str1=Str2[1..t]。其中,m 是字符串 Str2 的长度,Str2[1..t] 表示 Str2 的前 t 个字符组成的字符串。

输入格式:

输入文件的第 1 行包含 2 个正整数 n,k,中间用单个空格隔开,表示共有 n 种单词,需要使用 k 进制字符串进行替换。
接下来 n 行,第 i+1 行包含 1 个非负整数 wi,表示第 i 种单词的出现次数。

输出格式:

输出文件包括 2 行。
第 1 行输出 1 个整数,为《荷马史诗》经过重新编码以后的最短长度。
第 2 行输出 1 个整数,为保证最短总长度的情况下,最长字符串 si 的最短长度。

样例输入输出:

样例输入1:
4 2
1
1
2
2


12
2

题解:此题如果能够想到Huffman tree就很好搞了,题目的含义是要我们求出新编码长度leni乘以wi的总和。我们就可以把wi想成叶子节点权值,leni想成到root的长度,求解树的带权路径长度和叶子节点最大深度即可,不过,此题并非求二叉Huffman tree,而是求k叉Huffman tree,我们在建树时将k个最小的合并,另外确保一下k叉都是满的就可以了。
代码如下:

#include<stdio.h>#include<iostream>#include<algorithm>#include<cmath>#include<queue>#include<cstring>#define ll long longusing namespace std;ll n,k,cnt,ans=0;struct huff{    ll w;ll l;    bool operator<(const huff &a)const{        if(w!=a.w)return a.w<w;        return a.l<l;    }};priority_queue<huff> h;inline void re(ll &d){    bool f=false;char t=getchar();    while(t<'0'||t>'9'){if(t=='-')f=true;t=getchar();}    for(d=0;t>='0'&&t<='9';t=getchar())d=(d<<1)+(d<<3)+t-'0';    d=(f?(-d):(d));}int main(){    ll x;huff tmp;    re(n);re(k);    cnt=n;    for(int i=1;i<=n;i++)    {        re(x);tmp.w=x;tmp.l=1;        h.push(tmp);    }    if((n-1)%(k-1))cnt+=(k-1)-((n-1)%(k-1));    tmp.w=0;tmp.l=1;    for(int i=n+1;i<=cnt;i++)h.push(tmp);//处理不满K叉情况     while(cnt>1)    {        ll t1=0,t2=0;        for(int i=1;i<=k;i++)        {            tmp=h.top();h.pop();            t1+=tmp.w;t2=max(t2,tmp.l);        }        ans+=t1;cnt-=(k-1);        tmp.w=t1;tmp.l=t2+1;        h.push(tmp);//建huffman树     }    printf("%lld\n%lld\n",ans,h.top().l-1);}
阅读全文
1 0
原创粉丝点击