博弈入门—NIM&SG

来源:互联网 发布:虚拟机网络 编辑:程序博客网 时间:2024/05/22 14:03

//博弈是个好东西,可惜我不懂...所以最近恶补了一下...有点总结写给自己看..顺便分享一下求大佬赐教...

这里要先说一下必胜点(P-positio)和必败点(N-position)
必胜点和必败点的概念
       P点:必败点,换而言之,就是谁处于此位置,则在双方操作正确的情况下必败。
       N点:必胜点,处于此情况下,双方操作均正确的情况下必胜。
必胜点和必败点的性质
        1、所有终结点是 必败点 P 。(我们以此为基本前提进行推理,换句话说,我们以此为假设)
        2、从任何必胜点N 操作,至少有一种方式可以进入必败点 P。
        3、无论如何操作,必败点P 都只能进入 必胜点 N。

1.NIM游戏,NIM游戏从NOIP到NOI到ACM...都是最基础最简单的博弈...也是最经典的博弈...比如石子游戏

          n堆石子,两个人轮流拿,可以拿一堆或者一堆中的一部分,最后谁不能操作谁就输了

NIM游戏就是把这n堆石子分开考虑,考虑单独一堆的游戏情况,最后把n堆石子的游戏最终情况异或一下就是最终结果

根据定义,证明一种判断position的性质的方法的正确性,只需证明三个命题: 1、这个判断将所有terminal position判为P-position;2、根据这个判断被判为N-position的局面一定可以移动到某个P-position;3、根据这个判断被判为P-position的局面无法移动到某个P-position。
第一个命题显然,terminal position只有一个,就是全0,异或仍然是0。
第二个命题,对于某个局面(a1,a2,...,an),若a1^a2^...^an<>0,一定存在某个合法的移动,将ai改变成ai'后满足a1^a2^...^ai'^...^an=0。不妨设a1^a2^...^an=k,则一定存在某个ai,它的二进制表示在k的最高位上是1(否则k的最高位那个1是怎么得到的)。这时ai^k<ai一定成立。则我们可以将ai改变成ai'=ai^k,此时a1^a2^...^ai'^...^an=a1^a2^...^an^k=0。
第三个命题,对于某个局面(a1,a2,...,an),若a1^a2^...^an=0,一定不存在某个合法的移动,将ai改变成ai'后满足a1^a2^...^ai'^...^an=0。因为异或运算满足消去率,由a1^a2^...^an=a1^a2^...^ai'^...^an可以得到ai=ai'。所以将ai改变成ai'不是一个合法的移动。证毕。


2.Sprague-Grundy定理(SG定理):

游戏和的SG函数等于各个游戏SG函数的Nim和。这样就可以将每一个子游戏分而治之,从而简化了问题。而Bouton定理就是Sprague-Grundy定理在Nim游戏中的直接应用,因为单堆的Nim游戏 SG函数满足 SG(x) = x。

SG函数:首先定义mex(minimal excludant)运算,这是施加于一个集合的运算,表示最小的不属于这个集合的非负整数。例如mex{0,1,2,4}=3、mex{2,3,5}=0、mex{}=0。

对于任意状态 x , 定义 SG(x) = mex(S),其中 S 是 x 后继状态的SG函数值的集合。如 x 有三个后继状态分别为 SG(a),SG(b),SG(c),那么SG(x) = mex{SG(a),SG(b),SG(c)}。 这样 集合S 的终态必然是空集,所以SG函数的终态为 SG(x) = 0,当且仅当 x 为必败点P时。

比如另一种石子游戏

 有1堆n个的石子,每次只能取{ 1, 3, 4 }个石子,先取完石子者胜利,那么各个数的SG值为多少?

SG[0]=0,f[]={1,3,4},

x=1 时,可以取走1 - f{1}个石子,剩余{0}个,所以 SG[1] = mex{ SG[0] }= mex{0} = 1;

x=2 时,可以取走2 - f{1}个石子,剩余{1}个,所以 SG[2] = mex{ SG[1] }= mex{1} = 0;

x=3 时,可以取走3 - f{1,3}个石子,剩余{2,0}个,所以 SG[3] = mex{SG[2],SG[0]} = mex{0,0} =1;

x=4 时,可以取走4-  f{1,3,4}个石子,剩余{3,1,0}个,所以 SG[4] = mex{SG[3],SG[1],SG[0]} = mex{1,1,0} = 2;

x=5 时,可以取走5 - f{1,3,4}个石子,剩余{4,2,1}个,所以SG[5] = mex{SG[4],SG[2],SG[1]} =mex{2,0,1} = 3;

以此类推.....

   x        0  1  2  3  4  5  6  7  8....

SG[x]    0  1  0  1  2  3  2  0  1....

由上述实例我们就可以得到SG函数值求解步骤,那么计算1~n的SG函数值步骤如下:

1、使用 数组f 将 可改变当前状态 的方式记录下来。

2、然后我们使用 另一个数组 将当前状态x 的后继状态标记。

3、最后模拟mex运算,也就是我们在标记值中 搜索 未被标记值 的最小值,将其赋值给SG(x)。

4、我们不断的重复 2 - 3 的步骤,就完成了 计算1~n 的函数值。

如果当前状态由几个部分组成,那么SG等于这几个部分SG的异或值。

就和NIM游戏一样,如果每堆有x个石子,那么这一堆的SG值就是x,N堆的SG就是每堆SG的异或。

为什么SG的值和NIM和是一样的呢?

我的理解是如果当前SG值为x,那么它可以到达小于x的任何子状态,就和拿石子是一样的。但是也有可能到达比x更大的SG的子状态,但是就算一个人到达了这个SG更大的状态,第二个人又可以把SG变回原来的值,所以是没有影响的。最后游戏结束时,总有一个SG值是x的状态不能到达更大的SG...

这里给出一道题目:hdu1848

另一种石子游戏,在基本规则不变的基础上限制了每次能取的石子数量,但是本质上并没有发生变化

#include <stdio.h>#include <string.h>using namespace std;int f[10000];int sg[10000]={0};int vis[10000];void init(){f[0]=f[1]=1;sg[0]=0;for (int i=2;i<=16;i++) f[i]=f[i-1]+f[i-2];//预处理可改变的所有状态ffor (int i=1;i<=1000;i++){memset(vis,0,sizeof(vis));//vis标记当前状态x的后继状态for (int j=1;j<=16&&i>=f[j];j++)vis[sg[i-f[j]]]=1;for (int j=0;;j++)//模拟mex运算找到未被标记的最小值if (!vis[j]){sg[i]=j;break;}}}int main(){init();int a,b,c;while (~scanf("%d%d%d",&a,&b,&c)&&(a||b||c))if (sg[a]^sg[b]^sg[c]) puts("Fibo");//因为题目中给出三堆石子,所以看成单独的三堆分别进行游戏,最终结果就是三堆石子游戏结果的异或else puts("Nacci");return 0;} 





原创粉丝点击