BZOJ1076:奖励关(状压期望dp)

来源:互联网 发布:黑马程序员有公司要么 编辑:程序博客网 时间:2024/05/22 10:19

好像noip一眼看去,全是dp。
题面
题意:有k个回合,n个物品,每回合随机掉一个物品i,有P[i]的价值。可以选择捡或不捡。对于每件物品,若想捡它,都要捡完它的先决物品,问最大期望价值。n≤15,k≤100。

大概就是个状压dp,用f[S][i]表示i回合选了集合S的物品,所得到的最大期望。
若每回合都必须选,k回合后得到的每个状态的概率才是可算的。但由于策略原因,到达最终的每个状态的概率并不可知,无法计算对答案的贡献。所以这题用逆推。(其实我也是看dalao题解知道的…)

所以,用f[S][i]表示i回合选了集合S的物品,再经过k-i个回合,所能得到的最大期望。

考虑第i+1个回合,掉每件物品的概率都是1n
枚举会掉的物品j,若S中并不包含j的全部先决物品,有
f[S][i]+=1nf[S][i+1]
否则
f[S][i]+=1nmax(f[S|(1<<j)][i+1]+p[j],f[S][i+1])

f[0][1]为答案。

#include <iostream>#include <fstream>#include <algorithm>#include <cmath>#include <ctime>#include <cstdio>#include <cstdlib>#include <cstring>using namespace std;#define mmst(a, b) memset(a, b, sizeof(a))#define mmcp(a, b) memcpy(a, b, sizeof(b))typedef long long LL;int n,k,er[22];int need[22],val[22];double f[103][40040];int main(){    er[0]=1;    for(int i=1;i<=20;i++)    er[i]=er[i-1]*2;    cin>>k>>n;    for(int i=1;i<=n;i++)    {        scanf("%d",&val[i]);        int x;        scanf("%d",&x);        while(x)        {            need[i]|=er[x-1];            scanf("%d",&x);        }    }    for(int i=k;i>=1;i--)    for(int s=0;s<er[n];s++)    {        for(int j=1;j<=n;j++)        if((s&need[j])==need[j])        f[i][s]+=max(f[i+1][s],f[i+1][s|er[j-1]]+val[j]);        else        f[i][s]+=f[i+1][s];        f[i][s]/=n;    }    printf("%.6lf\n",f[1][0]);    return 0;}

这里写图片描述
珂学真是太好玩了。