bzoj 1419 Red is good 【期望dp】

来源：互联网发布：黎明杀机怎么优化fps 编辑：程序博客网时间：2024/05/21 09:00

Description

桌面上有R张红牌和B张黑牌，随机打乱顺序后放在桌面上，开始一张一张地翻牌，翻到红牌得到1美元，黑牌则付出1美元。可以随时停止翻牌，在最优策略下平均能得到多少钱。

Input

一行输入两个数R,B,其值在0到5000之间

Output

在最优策略下平均能得到多少钱。

Sample Input

5 1

Sample Output

4.166666

HINT

输出答案时,小数点后第六位后的全部去掉,不要四舍五入.

解题思路

关键是考虑什么时候是最优策略。
仔细想了就发现，如果当前期望都不是正数了，那不如不拿，这样当前期望就变为了0，其他情况都可以再拿，这样就可以最优了。

设f[i][j]表示还有i张红牌，j张黑牌的最优期望，那么：
f[i][j]=max（0，ii+j∗(f[i-1][j]+1)+ji+j∗(f[i][j-1]-1)）。
初始化f[i][0]=i;

注意输出，还有要开滚动数组。

#include<iostream>#include<cstdio>#include<cstring>#include<string>#include<algorithm>#include<cmath>#include<vector>#include<queue>#define ll long longusing namespace std;int getint(){    int i=0,f=1;char c;    for(c=getchar();(c<'0'||c>'9')&&c!='-';c=getchar());    if(c=='-')f=-1,c=getchar();    for(;c>='0'&&c<='9';c=getchar())i=(i<<3)+(i<<1)+c-'0';    return i*f;}const int N=5005;int n,m;double f[2][N];int main(){    //freopen("lx.in","r",stdin);    n=getint(),m=getint();    int now=1;    for(int i=1;i<=n;i++)    {        f[now][0]=i;        for(int j=1;j<=m;j++)            f[now][j]=max((double)0,i*1.0/(i+j)*(f[now^1][j]+1)+j*1.0/(i+j)*(f[now][j-1]-1));        now^=1;    }    now^=1;    double ans=floor(f[now][m]*1000000)*1.0/1000000;    printf("%0.6f",ans);    return 0;}

阅读全文

0 0