bzoj 1076(状压dp)(期望dp)

来源:互联网 发布:js隐式类型转换 编辑:程序博客网 时间:2024/06/07 04:48

传送门
题解:dp[i][j]表示第i轮状态为j(状态中为1的位表示当前物品还没被取走)的最大期望得分。为了防止从无效状态转移至有效状态,采用倒推法,从已知的有效状态往回推,具体注释在代码中。
P.S.不写memset可以快接近一倍,但是为了思维严密性,还是写一个,反正都能过(´∇`)
注意:由于吃过的宝物可以再吃(只有前提集合满足),所以if语句不能再加如下条件:(j&(1<<(k-1)))==0

#include<bits/stdc++.h>using namespace std;const int MAXN=17;int K,n,temp;int val[MAXN],st[MAXN];double dp[102][1<<17];int main() {//  freopen("bzoj 1076.in","r",stdin);    scanf("%d%d",&K,&n);    for (int i=1;i<=n;++i) {        scanf("%d%d",&val[i],&temp);        while (temp) st[i]+=(1<<(temp-1)),scanf("%d",&temp);    }    memset(dp,0,sizeof(dp));    for (int i=K;i;--i)        for (int j=0;j<=(1<<n)-1;++j) {            for (int k=1;k<=n;++k)                if ((st[k]&j)==st[k])//st[k]为j的子集,为有效状态                    dp[i][j]+=max(dp[i+1][j],dp[i+1][j|(1<<(k-1))]+val[k]);                else dp[i][j]+=dp[i+1][j];            dp[i][j]/=n;//概率为1/n        }    printf("%.6lf\n",dp[1][0]);    return 0;}