bzoj1076 奖励关SCOI2008 状压与期望DP
来源:互联网 发布:oracle sql state 编辑:程序博客网 时间:2024/05/22 08:19
Problem
Problem Description
你正在玩你最喜欢的电子游戏,并且刚刚进入一个奖励关。在这个奖励关里,系统将依次随机抛出k次宝物,每次你都可以选择吃或者不吃(必须在抛出下一个宝物之前做出选择,且现在决定不吃的宝物以后也不能再吃)。
宝物一共有n种,系统每次抛出这n种宝物的概率都相同且相互独立。也就是说,即使前k-1次系统都抛出宝物1(这种情况是有可能出现的,尽管概率非常小),第k次抛出各个宝物的概率依然均为
获取第 i 种宝物将得到Pi分,但并不是每种宝物都是可以随意获取的。第i种宝物有一个前提宝物集合Si。只有当Si中所有宝物都至少吃过一次,才能吃第i 种宝物(如果系统抛出了一个目前不能吃的宝物,相当于白白的损失了一次机会)。注意,Pi 可以是负数,但如果它是很多高分宝物的前提,损失短期利益而吃掉这个负分宝物将获得更大的长期利益。
假设你采取最优策略,平均情况你一共能在奖励关得到多少分值?
Input
第一行有两个正整数k和n,即宝物的数量和种类。以下n行分别描述一种宝物,其中第一个整数代表分值,随后的整数依次代表该宝物的各个前提宝物(各宝物编号为1到n),以0结尾。
Output
输出一个实数,保留六位小数,即在最优策略下平均情况的得分(即期望得分)。
Sample Input
#1
1 2
1 0
2 0
#2
6 6
12 2 3 4 5 0
15 5 0
-2 2 4 5 0
-11 2 5 0
5 0
1 2 4 5 0
Sample Output
#1
1.500000
#2
10.023470
Date Size
Solution
首先某些物品既然可能会有前提集合Si,而题目条件中给出了n的范围为
很容易想到利用DP来解决问题,令s表示之前已经取过宝物的状态,即用f[i][s]表示第i轮的状态为s时的期望得分。但是有一点问题,我们无法判断在i轮能否能到达s的状态,也就是有可能这个保存的答案其实是无效的。那么我们就可以采用倒推的方法。期望DP常用到倒推。
我们知道,
由此:令s依然表示之前已经取过宝物的状态,f[i][s]表示在第i到第k轮的期望得分。那么这个答案的储存位置就明确了,即f[1][0]。状态转移方程如下:
对于具备前提集合的,则有不取和取两种状态:
而不具备前提集合的,则只能选择不取:
Code
#include <algorithm>#include <iostream>#include <cstdio>using namespace std;int k,n,maxx,c[16],state[16];double f[105][1<<15];void input(){ int t; scanf("%d%d",&k,&n); for(int i=1;i<=n;i++) { scanf("%d",&c[i]); for(int j=1;;j++) { scanf("%d",&t); if(!t) break; state[i]|=(1<<t-1); } }}int main(){ input(); maxx=(1<<n)-1; for(int i=k;i>=1;i--) for(int s=0;s<=maxx;s++) { for(int j=1;j<=n;j++) { if((s&state[j])==state[j]) f[i][s]+=max(f[i+1][s],f[i+1][s|(1<<j-1)]+c[j]); else f[i][s]+=f[i+1][s]; } f[i][s]/=n; } printf("%.6lf\n",f[1][0]); return 0;}
- bzoj1076 奖励关SCOI2008 状压与期望DP
- bzoj1076 [SCOI2008]奖励关 状压+期望dp
- [期望DP] BZOJ1076: [SCOI2008]奖励关
- bzoj1076 [SCOI2008]奖励关(期望+dp)
- 【BZOJ1076】[SCOI2008]奖励关【期望DP】【状压DP】
- [BZOJ1076][SCOI2008]奖励关(状压dp+期望)
- 【BZOJ1076】【SCOI2008】奖励关(期望+状压dp)
- 【bzoj1076】【SCOI2008】【奖励关】期望最优值dp
- BZOJ1076 [SCOI2008]奖励关 【状压dp + 数学期望】
- BZOJ1076:奖励关(状压期望dp)
- bzoj1076: [SCOI2008]奖励关 压状dp
- 【bzoj1076】【SCOI2008】【奖励关】【状压dp】
- 【bzoj1076】[SCOI2008]奖励关 状压DP
- [bzoj1076][SCOI2008]奖励关 状压DP
- [BZOJ1076][SCOI2008]奖励关(状压DP)
- BZOJ 1076 SCOI2008 奖励关 期望状压DP
- scoi2008奖励关&&bzoj1076
- scoi2008奖励关&&bzoj1076
- sql语句索引
- iOS平台下cookie的使用
- ZooKeeper系列(二) Zookeeper的环境配置
- 团体程序设计天梯赛-练习集L1-002. 打印沙漏
- 使neutron不能创建相同名字以及相同cidr的子网
- bzoj1076 奖励关SCOI2008 状压与期望DP
- 正则表达式中/g的用法
- TOP100summit:【分享实录-华为】微服务场景下的性能提升最佳实践
- jquery中常见的面试题
- 51nod 1833 环 (dp)
- mongodb系列教程(一)-安装及配置服务
- el表达式
- 提交spark任务Requesting 1 new executor because tasks are backlogged (new desired total will be 1)
- JavaScript——变量提升