博弈入门（由于属于不同的博客网无法转载还望见谅）

来源：互联网发布：汇通网财经日历数据编辑：程序博客网时间：2024/04/30 21:28

博弈入门

寻找平衡状态（也称必败态，奇异局势），（满足：任意非平衡态经过一次操作可以变为平衡态）

一．巴什博奕（Bash Game）

只有一堆n个物品，两个人轮流从这堆物品中取物，规定每次至少取一个，最多取m个。最后取光者得胜。

显然，如果n=m+1，那么由于一次最多只能取m个，所以，无论先取者拿走多少个，后取者都能够一次拿走剩余的物品，后者取胜。因此我们发现了如何取胜的法则：如果n=（m+1）r+s，（r为任意自然数，s≤m),那么先取者要拿走s个物品，如果后取者拿走k（≤m)个，那么先取者再拿走m+1-k个，结果剩下（m+1）（r-1）个，以后保持这样的取法，那么先取者肯定获胜。总之，要保持给对手留下（m+1）的倍数，就能最后获胜。

一般方法：

步骤1:将所有终结位置标记为必败点（P点）；

步骤2: 将所有一步操作能进入必败点（P点）的位置标记为必胜点（N点）

步骤3:如果从某个点开始的所有一步操作都只能进入必胜点（N点），则将该点标记为必败点（P点）；

步骤4: 如果在步骤3未能找到新的必败（P点），则算法终止；否则，返回到步骤2。

二．威佐夫博奕(Wythoff Game)

有两堆各若干个物品，两个人轮流从某一堆或同时从两堆中取同样多的物品，规定每次至少取一个，多者不限，最后取光者得胜。

　　这种情况下是颇为复杂的。我们用（ak，bk）（ak ≤ bk ,k=0，1，2，...,n)表示两堆物品的数量并称其为局势，如果甲面对（0，0），那么甲已经输了，这种局势我们称为奇异局势。前几个奇异局势是：（0，0）、（1，2）、（3，5）、（4，7）、（6，10）、（8，13）、（9，15）、（11，18）、（12，20）。

可以看出,a0=b0=0,ak是未在前面出现过的最小自然数,而 bk= ak + k。

奇异局势有如下三条性质：

1。任何自然数都包含在一个且仅有一个奇异局势中。

由于ak是未在前面出现过的最小自然数，所以有ak > ak-1 ，而 bk= ak + k > ak-1 + k-1 = bk-1 > ak-1 。所以性质1成立。

2。任意操作都可将奇异局势变为非奇异局势。

事实上，若只改变奇异局势（ak，bk）的某一个分量，那么另一个分量不可能在其他奇异局势中，所以必然是非奇异局势。如果使（ak，bk）的两个分量同时减少，则由于其差不变，且不可能是其他奇异局势的差，因此也是非奇异局势。

3。采用适当的方法，可以将非奇异局势变为奇异局势。

假设面对的局势是(a,b)

若 b = a,则同时从两堆中取走 a 个物体,就变为了奇异局势(0,0)；

1. 如果a = ak,

1.1 b> bk, 那么,取走b - bk个物体,即变为奇异局势(ak, bk)；

1.2 b< bk 则同时从两堆中拿走 ak– a[b – ak]个物体,变为奇异局势( a[b – ak] , a[b – ak]+ b -ak)；

2 如果a = bk ,

2.1 b> ak ,则从第二堆中拿走多余的数量b– ak

2.2 b< ak ,则若b = aj (j < k) 从第一堆中拿走多余的数量a– bj; (a > bj)

若b = bj (j < k) 从第一堆中拿走多余的数量a– aj; ( a > aj)

结论：

两个人如果都采用正确操作，那么面对非奇异局势，先拿者必胜；反之，则后拿者取胜。

那么任给一个局势（a，b），怎样判断它是不是奇异局势呢？我们有如下公式：

ak =[k（1+√5）/2]，bk= ak + k （k=0，1，2，...n 方括号表示取整函数)

奇妙的是其中出现了黄金分割数（1+√5）/2 = 1.618...因此，由ak，bk组成的矩形近似为黄金矩形，由于2/（1+√5）=（√5-1）/2，可以先求出j=[a（√5-1）/2]，若a=[j（1+√5）/2]，那么a = aj，bj = aj + j，若不等于，那么a = aj+1，bj+1 = aj+1 + j + 1，若都不是，那么就不是奇异局势。然后再按照上述法则进行，一定会遇到奇异局势。

三．尼姆博奕(Nimm Game)

有三堆各若干个物品，两个人轮流从某一堆取任意多的物品，规定每次至少取一个，多者不限，最后取光者得胜。

　　这种情况最有意思，它与二进制有密切关系，我们用（a，b，c）表示某种局势，首先（0，0，0）显然是奇异局势，无论谁面对奇异局势，都必然失败。第二种奇异局势是（0，n，n），只要与对手拿走一样多的物品，最后都将导致（0，0，0）。仔细分析一下，（1，2，3）也是奇异局势，无论对手如何拿，接下来都可以变为（0，n，n）的情形。

　　计算机算法里面有一种叫做按位模2加，也叫做异或的运算，我们用符号（+）表示这种运算，先看（1，2，3）的按位模2加的结果：

1 =二进制01

2 =二进制10

3 =二进制11 （+）

———————

0 =二进制00 （注意不进位）

　　对于奇异局势（0，n，n）也一样，结果也是0。

　　任何奇异局势（a，b，c）都有a（+）b（+）c =0。

如果我们面对的是一个非奇异局势（a，b，c），要如何变为奇异局势呢？假设 a < b < c,我们只要将 c 变为 a（+）b,即可,因为有如下的运算结果: a（+）b（+）(a（+）b)=(a（+）a)（+）(b（+）b)=0（+）0=0。要将c 变为a（+）b，只要从 c中减去 c-（a（+）b）即可。

例题：

取火柴的游戏

题目1：今有若干堆火柴，两人依次从中拿取，规定每次只能从一堆中取若干根，可将一堆全取走，但不可不取，最后取完者为胜，求必胜的方法。

题目2：今有若干堆火柴，两人依次从中拿取，规定每次只能从一堆中取若干根，可将一堆全取走，但不可不取，最后取完者为负，求必胜的方法。

先解决第一个问题吧。

定义：若所有火柴数异或为0，则该状态被称为利他态，用字母T表示；否则，为利己态，用S表示。

[定理1]：对于任何一个S态，总能从一堆火柴中取出若干个使之成为T态。

证明：

若有n堆火柴，每堆火柴有A(i)根火柴数，那么既然现在处于S态，

c = A(1) xorA(2) xor … xor A(n) > 0;
把c表示成二进制，记它的二进制数的最高位为第p位，则必然存在一个A(t),它二进制的第p位也是1。（否则，若所有的A(i)的第p位都是0，这与c的第p位就也为0矛盾）。
那么我们把x = A(t) xor c,则得到x < A(t).这是因为既然A(t)的第p位与c的第p位同为1,那么x的第p位变为0,而高于p的位并没有改变。所以x< A(t).而
A(1) xor A(2) xor … xor x xor … xor A(n)
= A(1) xor A(2) xor … xor A(t) xor c xor … xor A(n)
= A(1) xor A(2) xor… xor A(n) xor A(1) xor A(2) xor … xor A(n)
= 0
这就是说从A(t)堆中取出 A(t) – x 根火柴后状态就会从S态变为T态。证毕
[定理2]：T态，取任何一堆的若干根，都将成为S态。
证明：用反证法试试。
  若
c = A(1) xor A(2) xor … xor A(i) xor … xor A(n) = 0；
c’ = A(1) xor A(2) xor … xor A(i’) xor c xor … xor A(n) =0;
  则有
c xor c’ = A(1) xor A(2) xor … xor A(i) xor … xor A(n) xor A(1) xor A(2) xor …xor A(i’) xor c xor … xor A(n) = A(i) xor A(i’) =0
  进而推出A(i) = A(i’)，这与已知矛盾。所以命题得证。
[定理 3]：S态，只要方法正确，必赢。
   最终胜利即由S态转变为T态，任何一个S态，只要把它变为T态，（由定理1，可以把它变成T态。）对方只能把T态转变为S态(定理2)。这样，所有S态向T态的转变都可以有己方控制，对方只能被动地实现由T态转变为S态。故S态必赢。
[定理4]：T态，只要对方法正确，必败。
  由定理3易得。
    接着来解决第二个问题。
定义：若一堆中仅有1根火柴，则被称为孤单堆。若大于1根，则称为充裕堆。
定义：T态中，若充裕堆的堆数大于等于2，则称为完全利他态，用T2表示；若充裕堆的堆数等于0，则称为部分利他态，用T0表示。
孤单堆的根数异或只会影响二进制的最后一位，但充裕堆会影响高位（非最后一位）。一个充裕堆，高位必有一位不为0，则所有根数异或不为0。故不会是T态。
[定理5]：S0态，即仅有奇数个孤单堆，必败。T0态必胜。
证明：
S0态，其实就是每次只能取一根。每次第奇数根都由己取，第偶数根都由对方取，所以最后一根必己取。败。同理, T0态必胜。
[定理6]：S1态，只要方法正确，必胜。
证明：
若此时孤单堆堆数为奇数，把充裕堆取完；否则，取成一根。这样，就变成奇数个孤单堆，由对方取。由定理5，对方必输。己必胜。
[定理7]：S2态不可转一次变为T0态。
证明：
充裕堆数不可能一次由2变为0。得证。

[定理8]：S2态可一次转变为T2态。
证明：
由定理1，S态可一次转变为T态，又由定理7，S2态不可转一次变为T0态，所以转变的T态为T2态。
[定理9]：T2态，只能转变为S2态或S1态。
证明：
由定理2，T态必然变为S态。由于充裕堆数不可能一次由2变为0，所以此时的S态不可能为S0态。命题得证。
[定理10]：S2态，只要方法正确，必胜.
证明：
方法如下：
1） S2态，就把它变为T2态。（由定理8）
2）对方只能T2转变成S2态或S1态（定理9）
若转变为S2, 转向1）
若转变为S1, 这己必胜。（定理6）
[定理11]：T2态必输。
证明：同10。
综上所述，必输态：T2,S0 ；必胜态： S2,S1,T0。
两题比较：
第一题的全过程其实如下：
S2->T2->S2->T2-> …… ->T2->S1->T0->S0->T0->……->S0->T0(全0)
第二题的全过程其实如下：
S2->T2->S2->T2-> …… ->T2->S1->S0->T0->S0->……->S0->T0(全0)
下划线表示胜利一方的取法。是否发现了他们的惊人相似之处。

我们不难发现(见加粗部分)，S1态可以转变为S0态（第二题做法），也可以转变为 T0（第一题做法）。哪一方控制了S1态，他即可以有办法使自己得到最后一根（转变为 T0）,也可以使对方得到最后一根（转变为S0）。

所以，抢夺S1是制胜的关键！

为此，始终把T2态让给对方，将使对方处于被动状态，他早晚将把状态变为S1。

后继点和SG值的问题:
SG值：一个点的SG值就是一个不等于它的后继点的SG的且大于等于零的最小整数。
后继点：也就是按照题目要求的走法（比如取石子可以取的数量，方法）能够走一步达到的那个点。

1536的参考代码
本部分设定了隐藏,您已回复过了,以下是隐藏的内容
Copy code
//博弈-基于求SG值
//Accepted 1536 578MS 416K 904 B

#include”iostream”using namespace std;int f[101],sg[10001],k;int mex(int b){    int a[101]={0},i;    for(i=0;i<k;i++)    {        if(b-f<0)//b-f后继点            break;        if(sg[b-f]==-1)        {            sg[b-f]=mex(b-f);        }        a[sg[b-f]]=1;    }    for(i=0;i<k;i++)        if(!a)        {            return i;        }}int main(){    int i,t,n,s,bead,j;    while(cin >> k,k)    {        for(i=0;i<k;i++)        {            cin >> f;        }        memset(sg,-1,sizeof(sg));        for(i=0;i<k;i++)            for(j=i+1;j<k;j++)                if(f>f[j])                {                    f+=f[j];                   f[j]=f-f[j];                    f-=f[j];                }        sg[0]=0;        cin >> t;        while(t–)        {            cin >> n;            s=0;            while(n–)            {                cin >> bead;//该堆的成员个数                if(sg[bead]==-1)                   sg[bead]=mex(bead);                s=s^sg[bead];            }            if(s==0)                cout << “L”;            else                cout << “W”;        }        cout << endl;    }    return 0;}

1517参考代码
本部分设定了隐藏,您已回复过了,以下是隐藏的内容
Copy code
//博弈-基于求SG值
//Accepted 1517 234MS 0K 837 B

#include<iostream>using namespace std;int main(){    __int64 a[7000]= {1},min,n;    int p[10],sg[7000],i,j,k;    for(i=2; i<10; p=0,i++);    for(i=1; i<7000; i++)    {        for(j=2,min=-1; j<10; j++)            if(min==-1||a[p[j]]*j<a[p[min]]*min)                min=j;        a=a[p[min]]*min;        min=a[p[min]]*min;        if(a>=5000000000)            break;        for(j=2; j<10; j++)            if(a[p[j]]*j==min)                p[j]++;    }//从小到大求出所有乘积    while(scanf("%I64d",&n)!=EOF)    {        for(i=0; i<7000; i++)        {            sg=0;            if(a>=n)                break;        }        for(j=i-1; a[j]*9>=n&&j>=0; j--)            sg[j]=1;        while(j>=0)        {            for(k=j+1; k<i&&a[j]*9>=a[k]; k++)                if(a[k]%a[j]==0&&sg[k]==0)                {                    sg[j]=1;                    break;                }            j--;        }        puts(sg[0]?"Stan wins.":"Ollie wins.");    }    return 0;}




                                                     0        0           	
					
					   博弈入门（由于属于不同的博客网无法转载还望见谅）
	  	   基础入门博客一览(无法直接转载)
	  	   转载一篇博弈博弈入门的好文章
	  	   单词博弈解题思路，转载“miss若尘”的博客
	  	   Windows 中属于不同Owner的Workspace 互相无法看见，且无法删除
	  	   导入github下载的项目时，由于gradle版本不同而造成的无法编译解决办法
	  	   转载的 博弈
	  	   关于OkGo中由于响应码不同返回的错误提示无法获取解决方案
	  	   写属于自己的博客
	  	   Android SDK的AVD由于中文路径名无法启动的解决方法(转载)
	  	   （转载）博弈
	  	   博弈模板（转载）
	  	   VS中MFC连接MySQL由于系统不同位（32/64）引起的错误：无法解析的外部符号 _mysql_init@4、_mysql_query
	  	   VS中MFC连接MySQL由于系统不同位（32/64）引起的错误：无法解析的外部符号 _mysql_init@4,_mysql_query,_mysql_error
	  	   VS中MFC连接MySQL由于系统不同位（32/64）引起的错误：无法解析的外部符号 _mysql_init@4、_mysql_query
	  	   linux下搭建属于自己的博客（WordPress安装）
	  	   linux下搭建属于自己的博客（WordPress安装）
	  	   HEXO+Github,搭建属于自己的博客（下）
	     		  
	  	   NoSQL学习笔记(二)之CAP理论
	  	   【高级特性】String，StringBuffer，StringBuilder
	  	   JDK自带VM分析工具jps，jstat，jmap，jconsole
	  	   WebView
	  	   docker安装（二）
	  	   博弈入门（由于属于不同的博客网无法转载还望见谅）
	  	   有代表性的并发服务器端模型
	  	   tensorflow学习笔记（二十七）：leaky relu
	  	   [hash]Hashcat Example
	  	   剑指offer-----输出二叉树的后继节点(java版)
	  	   linux下ftp工具
	  	   HTML5+CSS3+JS学习笔记-10-CSS3之2D转换的用法
	  	   Test
	  	   【JDBC4.2】二、获取Connection