hdu-4597 （博弈DP）

来源：互联网发布：手机网络新游戏编辑：程序博客网时间：2024/06/10 03:48

该题是用dp推导博弈题的经典例子，仔细想想就会发现，这其实就是一个区间处理的问题，一般区间问题还是比较简单的一类题目。

由于两个孩子都很聪明，所以他们一定都尽可能的选择最优方案，所以每个人当前的最优解都依赖于下一个人的最优解。那么怎么处理细节呢？还是老调重弹，先想状态如何表示，再想状态如何转移。

很显然，要想完整的描述状态，我们必须开四维数组，记录两堆牌当前的状态。那么状态不难表示成 d[al][ar][bl][br] , 表示两堆牌当前的首尾情况下，所能获得的最大分数，那么状态如何转移呢？

前面说了，当前最优解依赖于之前的最优解，因为两个孩子都很聪明。推DP要时刻注意状态表示的是什么，刚才说了表示该孩子的最大分数，那么怎么求呢？显然等于总分减去下一个孩子的得分，下一个孩子的”总分“就要减去当前孩子拿走的牌。

细节参见代码：

#include<bits/stdc++.h>using namespace std;int T,n,d[25][25][25][25],a[25],b[25];int dp(int al,int ar,int bl,int br,int sum) {    int& ans = d[al][ar][bl][br];    if(ans != -1) return ans;    ans = 0;    if(al<=ar) {        ans = max(ans,sum-dp(al+1,ar,bl,br,sum-a[al]));        ans = max(ans,sum-dp(al,ar-1,bl,br,sum-a[ar]));    }    if(bl<=br) {        ans = max(ans,sum-dp(al,ar,bl+1,br,sum-b[bl]));        ans = max(ans,sum-dp(al,ar,bl,br-1,sum-b[br]));    }    return ans;}int main() {    scanf("%d",&T);    while(T--) {        scanf("%d",&n);        int sum = 0;        memset(d,-1,sizeof(d));        for(int i=1;i<=n;i++) scanf("%d",&a[i]) , sum += a[i];        for(int i=1;i<=n;i++) scanf("%d",&b[i]) , sum += b[i];        int ans = dp(1,n,1,n,sum);        printf("%d\n",ans);    }    return 0;}

1 0