BZOJ1076：奖励关（状压期望dp）

来源：互联网发布：黑马程序员有公司要么编辑：程序博客网时间：2024/05/22 10:19

好像noip一眼看去，全是dp。
题面
题意：有k个回合，n个物品，每回合随机掉一个物品i，有P[i]的价值。可以选择捡或不捡。对于每件物品，若想捡它，都要捡完它的先决物品，问最大期望价值。n≤15，k≤100。

大概就是个状压dp，用f[S][i]表示i回合选了集合S的物品，所得到的最大期望。
若每回合都必须选，k回合后得到的每个状态的概率才是可算的。但由于策略原因，到达最终的每个状态的概率并不可知，无法计算对答案的贡献。所以这题用逆推。（其实我也是看dalao题解知道的…）

所以，用f[S][i]表示i回合选了集合S的物品，再经过k-i个回合，所能得到的最大期望。

考虑第i+1个回合，掉每件物品的概率都是1n。
枚举会掉的物品j，若S中并不包含j的全部先决物品，有
f[S][i]+=1nf[S][i+1]
否则
f[S][i]+=1nmax(f[S|(1<<j)][i+1]+p[j],f[S][i+1])

f[0][1]为答案。

#include <iostream>#include <fstream>#include <algorithm>#include <cmath>#include <ctime>#include <cstdio>#include <cstdlib>#include <cstring>using namespace std;#define mmst(a, b) memset(a, b, sizeof(a))#define mmcp(a, b) memcpy(a, b, sizeof(b))typedef long long LL;int n,k,er[22];int need[22],val[22];double f[103][40040];int main(){    er[0]=1;    for(int i=1;i<=20;i++)    er[i]=er[i-1]*2;    cin>>k>>n;    for(int i=1;i<=n;i++)    {        scanf("%d",&val[i]);        int x;        scanf("%d",&x);        while(x)        {            need[i]|=er[x-1];            scanf("%d",&x);        }    }    for(int i=k;i>=1;i--)    for(int s=0;s<er[n];s++)    {        for(int j=1;j<=n;j++)        if((s&need[j])==need[j])        f[i][s]+=max(f[i+1][s],f[i+1][s|er[j-1]]+val[j]);        else        f[i][s]+=f[i+1][s];        f[i][s]/=n;    }    printf("%.6lf\n",f[1][0]);    return 0;}

这里写图片描述
珂学真是太好玩了。

阅读全文

0 0