博弈论总结

来源:互联网 发布:云墙 mac 编辑:程序博客网 时间:2024/04/26 17:28


先来总结一些基础博弈吧,毕竟我也是博弈小白.


此类问题一般有如下特点:

1、博弈模型为两人轮流决策的非合作博弈。即两人轮流进行决策,并且两人都使用最优策略来获取胜利。

2、博弈是有限的。即无论两人怎样决策,都会在有限步后决出胜负。

3、公平博弈。即两人进行决策所遵循的规则相同。

在此先强调一下,博弈重在寻找必胜态和必败态.一般找到必胜态必败态许多问题就迎刃而解了.

必败态: 毫无疑问就是当前状态无论怎么操作都是必输.(也就是当前步无论怎么走到达的全是必胜态,即把必胜态扔给对方)

必胜态: 下一步的操作中存在至少一个必败态.(即我可以走这一步操作,把必败态给了对方)


几种基本的博弈类型: (只给出结论,证明见:点击打开链接)


1.巴什博奕

问题模型:只有一堆n个物品,两个人轮流从这堆物品中取物品,规定每次至少取一个,最多取m个,最后取光者得胜。

      结论:n%(m+1)==0先手必败.否则先手必胜

     变形:条件不变,改为最后取光的人输。 结论:(n-1)%(m+1)==0 先手必败,否则必胜


2. 威佐夫博奕

问题模型:有两堆各若干个物品,两个人轮流从某一堆或同时从两堆中取同样多的物品,规定每次至少取一个,多者不限,

最后取光者得胜。

结论: k=(b-a) (a>b) s = (double )( k * ( sqrt(5.0) + 1 ) / 2 ); s==a 先手必败,否则必胜

  3.尼姆博弈

   问题模型:有三堆各若干个物品,两个人轮流从某一堆取任意多的物品,规定每次至少取一个,多者不限,最后取光者得胜。

    结论: 当石子堆数为n堆时,则推广为当对每堆的数目进行亦或之后值为零是必败态。

 4.sg函数

对于ICG游戏,我们可以将游戏中每一个可能发生的局面表示为一个点。并且若存在局面i和局面j,且j是i的后继局面

(即局面i可以转化为局面j),我们用一条有向边,从i出发到j,连接表示局面i和局面j的点。则整个游戏可以表示成为

一个有向无环图:


根据ICG游戏的定义我们知道,任意一个无法继续进行下去的局面为终结局面,即P局面(先手必败)。在上图中我们

可以标记所有出度为0的点为P点。

接着根据ICG游戏的两条性质,我们可以逆推出所有点为P局面还是N局面:

因此,对于任意一个ICG游戏,我们可以采取逆推的方法,标记出所有局面是N局面还是P局面。
但仅仅只是标记N、P,所能得到的信息太少,于是我们定义了Sg(Sprague-Grundy)函数:

对于一个游戏可能发生的局面x,我们如下定义它的sg值:
(1)若当前局面x为终结局面,则sg值为0。
(2)若当前局面x非终结局面,其sg值为:sg(x) = mex{sg(y) | y是x的后继局面}。
mex{a[i]}表示a中未出现的最小非负整数。举个例子来说:
mex{0, 1, 2} = 3, mex{1, 2}=0, mex{0,1,3}=2

我们将上图用sg函数表示后,得到:

可以发现,若一个局面x为P局面,则有sg(x)=0;否则sg(x)>0。同样sg值也满足N、P之间的转换关系:
若一个局面x,其sg(x)>0,则一定存在一个后续局面y,sg(y)=0。
若一个局面x,其sg(x)=0,则x的所有后续局面y,sg(y)>0。

由上面的推论,我们可以知道用N、P-Position可以描述的游戏用sg同样可以描述。并且在sg函数中

还有一个非常好用的定理,叫做sg定理:
对于多个单一游戏,X=x[1..n],每一次我们只能改变其中一个单一游戏的局面。则其总局面的sg值

等于这些单一游戏的sg值异或和。
即:
sg(X) = sg(x[1]) xor sg(x[2]) xor … xor sg(x[n])
要证明这一点我们只要证明:
(1) 假设sg(x[1]) xor sg(x[2]) xor … xor sg(x[n]) = A,对于任意一个0 <= B < A,总存在一个X的后续局面Y,

使得sg(Y) = B。
(2) 假设sg(x[1]) xor sg(x[2]) xor … xor sg(x[n]) = A,不存在一个X的后续局面Y,使得sg(Y) = A。
下先证明(1):
假设M = A xor 
B,设M表示为二进制之后最高位的1为第k位。所以A的第k位为1,B的第k位为0。又因为A的第k位为1,

至少存在一个i,sg(x[i])的第k位也为1。那么一定有sg(x[i]) xor M < sg(x[i]),即一定通过某个操作使x[i]变为x[i’],

且sg(x[i’]) = sg(x[i]) xor M。那么:

sg(x[i’]) xor Other = sg(x[i]) xor M xor Other = M xor A = B
下证明(2):
若sg(X) = A,sg(Y) = A。不妨设我们改变的游戏为x[i],则X=x[1..n], Y=x[1…i’…n]。有sg(x[i]) = sg(x[i’]),

产生矛盾,所以sg(Y)不可能等于A。


5.阶梯博弈

博弈在一列阶梯上进行...每个阶梯上放着自然数个点..两个人进行阶梯博弈...每一步则是将一个集体上的

若干个点( >=1 )移到前面去..最后没有点可以移动的人输..

阶梯博弈也是可以转化成尼姆博弈的.

把所有奇数阶梯看成N堆石子..做nim..把石子从奇数堆移动到偶数堆可以理解为拿走石子..就相当于几个

奇数堆的石子在做Nim..

6.Chomp!博弈(巧克力游戏)


有一个n*m的棋盘,每次可以取走一个方格并拿掉它右边和上面的所有方格。拿到左下角的格子(1,1)者输,如下图是8*3的

棋盘中拿掉(6,2)和(2,3)后的状态。




结论:答案是除了1*1的棋盘,对于其他大小的棋盘,先手总能赢。


分析:有一个很巧妙的证明可以保证先手存在必胜策略,可惜这个证明不是构造性的,也就是说没有给出先手怎么下才能赢。


证明如下:

如果后手能赢,也就是说后手有必胜策略,使得无论先手第一次取哪个石子,后手都能获得最后的胜利。那么现在假设先手

最右上角的石子(n,m),接下来后手通过某种取法使得自己进入必胜的局面。但事实上,先手在第一次取的时候就可以和

后手这次取的一样,进入必胜局面了,与假设矛盾。




巧克力游戏的变形:


约数游戏:有1~n个数字,两个人轮流选择一个数字,并把它和它的约数擦去。擦去最后一个数的人赢,问谁会获胜。


分析:类似巧克力游戏,得到结论就是无论n是几,都是先手必胜。




翻棋子游戏:


题意:一个棋盘上每个格子有一个棋子,每次操作可以随便选一个朝上的棋子(x,y),代表第i行第j列的棋子,选择一个形

(x,b)或(a,y)(其中b < y,a < x)的棋子,然后把它和(x,y)一起翻转,无法操作的人输。


分析:把坐标为(x,y)的棋子看成大小分别为x和y的两堆石子,则本题转化为了经典的Nim游戏,如果难以把棋子看作石

子,可以先把Nim游戏中的一堆石子看成一个正整数,则Nim游戏中的每次操作是把其中一个正整数减小或者删除。




题目:

POJ1704 阶梯博弈变形

题意:

从左到右有一排石子,给出石子所在的位置。规定每个石子只能向左移动,且不能跨过前面的石子。最左边的石子最多只能移动

到1位置。每次选择一个石子按规则向左移动,问先手是否能赢。


思路:

首先,按照我上面说的,先来寻找必胜态和必败态。什么时候会是必败态,小范围的,当只有两个石子的时候,先手必胜的. 也就是说

这时候谁先移动前面那颗石子谁就输了,另一个人就一直移动后面那个石子贴着前面那个,一直这样下去必输.

那么如果棋盘上有多对石子怎么办,我们根据上面那个想象一下,每对石子的前一个和上一个石子的后一个的距离对结果无影响.

对于每对石子之间,什么时候能紧贴着,那就没法走了只能移动前面那个石子,这个过程可以看成是一堆石子取空了.一对点的距离就是

石子数量

所以我们对这些石子排序,从后往前每两个一对,如果是奇数第一个数自己一堆.

#include<iostream>#include<cstdio>#include<algorithm>using namespace std;const int maxn = 1e3+10;int n;int a[maxn];int main(){int _;cin>>_;while(_--){cin>>n;for(int i = 1;i <= n;++i){cin>>a[i];}int ans = 0;sort(a+1,a+1+n);if(n %2 == 0){for(int i = n;i >= 2;i -= 2){ans ^= (a[i] - a[i-1] - 1);}}else{for(int i = n;i >= 1;i -= 2)ans ^= (a[i] - a[i -1] - 1);}if(ans != 0)puts("Georgia will win");elseputs("Bob will win");}return 0;}

阶梯博弈变形

HDU - 4315

题意:

有n个人爬山,山顶坐标为0,其他人按升序给出,不同的坐标只能容纳一个人(山顶不限),Alice和Bob轮流选择一个人让他移动任意步,

但不能越过前面的人,且不能和前面一个人在相同的位置。现在有一个人是king,给出king是哪个人(id),谁能将国王移动到山顶谁胜。

思路:

这个题和上面那个很像,首先考虑不存在国王的情况,全是普通人,那就是上面那种情况了.还是相邻一组,考虑奇偶。

但是现在有国王了,1.当国王在第一个,先手必胜.2.当数量为奇数,并且国王在第二个的时候需要把第一个的距离减1,因为他不能直接移走,否则

又成了国王在第一个的情况必胜.3.其余的情况就把国王当成普通人处理就好.



#include<iostream>#include<cstdio>#include<algorithm>using namespace std;const int maxn = 1e3+10;int n,k;int a[maxn];int main(){while(cin>>n>>k){for(int i = 1;i <= n;++i){cin>>a[i];}if(k==1){puts("Alice");continue;}int ans;ans = 0;if(n % 2 == 0 || k != 2)a[0] = -1;elsea[0] = 0;for(int i = n;i >= 1;i -= 2){ans ^= (a[i] - a[i-1] - 1);}if(ans != 0)puts("Alice");elseputs("Bob");}return 0;}



hihocoder1172


题意;

Alice和Bob这一次准备玩一个关于硬币的游戏:N枚硬币排成一列,有的正面朝上,有的背面朝上,从左到右依次编号为1..N。

现在两人轮流翻硬币,每次只能将一枚正面朝上的硬币翻过来,并且可以随自己的意愿,在一枚硬币翻转后决定要不要将该硬币左边

的任意一枚硬币也翻一次(正面翻到背面或背面翻到正面)。翻最后一枚正面向上的硬币的人获胜。同样的,这次游戏里面Alice仍然先

手,两人均采取最优的策略,对于给定的初始局面,Alice会获胜还是Bob会获胜?

思路:

首先,我们先将局面分解一下,每一次我们只考虑一枚硬币。
不妨设所有硬币全部背面朝上的局面为局面0
假设现在N枚硬币,只有第1枚是正面朝上的。该局面只能转化为全部硬币背面朝上的局面。我们假定该局面为 局面1,则局面1可以

转化为局面0。
假设只有第2枚是正面朝上的。该局面可以转化为:只有硬币1正面朝上;全部硬币背面朝上。我们假定该局面为 局面2,局面2可以

转化为局面1和局面0。
同理我们可以推定,第i枚硬币正面朝上的局面为局面i,局面i可以转化为局面0..i-1。

现在,我们考虑把给定的局面拆成单个硬币的局面集合,比如给定了{HHTHTTHT},其中H表示正面朝上,T表示背面朝上。那么就

是当前局面={局面1,局面2,局面4,局面7}。每一次我们可以改变其中个一个局面,当出现局面0时就从集合中删去。
这样一看是不是就变成了Nim游戏了?然而事实并没有那么简单。

进一步分析,若同时存在i,j(j<i)两枚硬币正面朝上。我们将这个局面拆成2个单一的局面:即局面i和局面j。
在反转i的时候我们考虑从局面i转移到局面j,那么我们会有两个局面j。
表示第j枚被反转了2次,也就是回到了背面朝上的状态。
那么我们得到这个游戏一个性质:当出现两个同样的局面时,等价于这两个局面合并变成了局面0。

这种情况在Nim游戏中是没有的,那么它会对Nim游戏的状态造成影响么?
我们想一想,在Nim游戏中,如果出现两个数量相同的堆时,比如A[i]=A[j]。在计算Nim游戏状态时我们采用的xor操作,xor有交换律

和结合律。则我们可以变成:
(A[i] xor A[j]) xor Other
因为A[i] = A[j],所以A[i] xor A[j] = 0。上式实际就是:
0 xor Other
也就是说在原Nim游戏中,若出现了两个数量相同的堆时,实际上这两堆已经不对总局面造成影响了,也就可以认为这两对合并为了

一个数量为0的堆。

到此,我们可以发现这个硬币游戏完全满足Nim游戏的规则,其解答也满足Nim游戏的性质,这题也就很简单的转化为了普通的Nim

游戏。在实际的博弈游戏中会发现很多都是可以转化为Nim游戏模型。如何正确的建立模型和转化游戏模型也就是解决博弈游戏一个

很重要的手段。

#include<bits/stdc++.h>const int maxn = 1e4 + 10;using namespace std;char s[maxn];int main(){int n;int x;int ans = 0;cin>>n;scanf("%s",s);for(int i = 0;i < n ;i++){if(s[i] == 'H')ans ^= (i+1);}if(ans == 0)puts("Bob");elseputs("Alice");return 0; } 




hihocoder 1173

HDU - 5795


题意:

在这一次游戏中Alice和Bob决定在原来的Nim游戏上增加一条规则:每一次行动时,不仅可以选择一堆取走任意数量的石子(至少取1

颗,至多取出这一堆剩下的所有石子),还可以选择将一堆石子分成两堆石子,但并不取走石子。比如说有一堆石子为k个,当Alice或

者Bob行动时,可以将这一堆石子分成两堆,分别为x,y。满足x+y=k,x,y>0。那么增加了这一条规则后,在Alice总先手的情况下,请

你根据石子堆的情况判断是Alice会获胜还是Bob会获胜?


思路:

这两个题目基本一样,根据sg函数的定理:

对于多个单一游戏,X=x[1..n],每一次我们只能改变其中一个单一游戏的局面。则其总局面的sg值等于这些单一游戏的sg值

异或和。
即:
sg(X) = sg(x[1]) xor sg(x[2]) xor … xor sg(x[n])

我们只需要算单个的就好. 由于数据比较大,我们不可能把所有的sg函数值处理出来,所以打表找找规律.

#include<bits/stdc++.h>const int maxn = 2e4+10;using namespace std;int n;int a[111];bool vis[maxn];int sg[maxn];void init(){sg[0] = 0;for(int i = 1;i <= 100;i++){for(int j = 1;j <= 100;j++) vis[j] = 0;for(int j = 1;j < i ;j++){vis[sg[j]] = 1;vis[sg[j] ^ sg[i - j]] = 1;}for(int j = 1;j <= 100;j++){sg[i] = j;if(!vis[j]){break;}}}for(int i = 1;i <= 100;i++)printf("%d %d\n",i,sg[i]);return ;}int main(){//init();while(cin>>n){int ans = 0;for(int i = 1;i <= n;i++){int x;scanf("%d",&x);if(x % 4 == 0){ans ^= (x - 1);}else if( (x+1) % 4 == 0){ans ^= (x + 1);}else ans ^= x; }if(ans == 0)puts("Bob");elseputs("Alice");}return 0;}

#include<bits/stdc++.h>typedef long long ll;const int maxn = 2e4+10;using namespace std;int n;ll a[111];bool vis[maxn];ll sg[maxn];void init(){sg[0] = 0;for(int i = 1;i <= 100;i++){for(int j = 1;j <= 100;j++) vis[j] = 0;for(int j = 1;j < i ;j++)vis[sg[j]] = 1;for(int j = 1;j < i;j++) for(int k = 1;k < i - j;k++) vis[sg[j] ^ sg[k] ^ sg[i-j-k]] = 1;for(int j = 1;j <= 100;j++){sg[i] = j;if(!vis[j]){break;}}}for(int i = 1;i <= 100;i++)printf("%d %d\n",i,sg[i]);return ;}int main(){//init();int _;cin>>_;while(_--){cin>>n;ll ans = 0;for(int i = 1;i <= n;i++){ll x;scanf("%lld",&x);if(x % 8 == 0){ans ^= (x - 1);}else if( (x+1) % 8 == 0){ans ^= (x + 1);}else ans ^= x; }if(ans == 0)puts("Second player wins.");elseputs("First player wins.");}return 0;}

zoj 3599


K倍动态减法游戏. 当k为2时,为斐波那契博弈.


这个东西比较高深啊...看了好久也只是懂了一点.


#include <stdio.h>  #include <iostream>  using namespace std;    long long a[3000000], b[3000000];  //a[] 所有的必败态的数//b[] 保存 a[0...i] 组合能够构造的最大数字 int main (void)  {      int t;      scanf("%d", &t);      while(t --)      {          int m;          long long n;          scanf("%d %lld", &m, &n);          a[0] = b[0] = 1;          int i = 0, j = 0;           while(n > a[i])          {              i ++;              a[i] = b[i - 1] + 1;              while(a[j + 1] * m < a[i])                  j++;              if(a[j] * m < a[i])                  b[i] = b[j] + a[i];              else                  b[i] = a[i];          }          long long ans;          if(n == a[i])  //a 数组存的全部是必败态的数             ans = (long long)n - i - 1;//因为n不能取 1 所以要减1           else              ans = (long long)n - i;//i是a的下标,也正好是比N小的不能取的数的个数   (包括1)         printf("%lld\n", ans);      }      return 0;  }  


除法游戏:


题目:http://uva.onlinejudge.org/index.php?option=com_onlinejudge&Itemid=8&page=show_problem&problem=2959


题意:有一个n*m的矩阵,每个元素均为2~10000之间的正整数。两个游戏者轮流操作。每次可以选一行中的1个或者多个于1的整数,把

它们中的每个数都变成它的某个真因子,比如12可以变成1,2,3,4或者6,不能操作的输(换句话说,如果操作之前,

矩阵中的所有数都是1,则他输)。


分析:考虑每个数的素因子个数,比如12包含3个素因子,则让一个数变成它的真因子等价于拿掉它的一个或者多个素因

子。这样,每行对应于一个石堆,每个数的每个素因子看成是一颗石子,则本题就和Nim游戏完全等价了。