几个简单的博弈例子

来源:互联网 发布:新浪短网址api js 编辑:程序博客网 时间:2024/05/01 11:12

几个简单的博弈例子


16340167
数据科学与计算机学院


博弈的本意是下棋,现在也引申为:在一定条件下,遵守一定的规则,一个或几个拥有绝对理性思维的人或团队,从各自允许选择的行为或策略进行选择并加以实施,并从中各自取得相应结果或收益的过程。这里会写几个简单的博弈例子,介绍一下博弈1。
目录

  • 囚徒博弈2
  • 海盗博弈
  • 枪手博弈

囚徒博弈

警察抓获了两个惯偷,但是两个惯偷都拒不认罪,而警察也没有足够的证据来证明他们的偷盗行为。于是,警察将他们分开审问。现在每个小偷有了两个选择:认罪或是不认罪。而他们面临的处罚也由他们的选择决定:

  • 如果两个小偷都不认罪,那么警察由于证据不足,只能判定他们非法入侵,二人都会被判刑半年
  • 如果两个小偷都认罪,他们都将被判刑两年
  • 如果某一个小偷认罪而另一个小偷不认罪,那个认罪的小偷因为坦白和检举同伙将被当场释放,而拒不认罪的那个小偷由于欺诈将面临判刑十年的处罚。

我们将两个小偷(之后用甲、乙称呼)的选择和判刑时间(单位:年)列出来:

甲\乙 认罪 不认罪 认罪 2 \ 2 0\10 不认罪 10\0 0.5\0.5

现在,两个小偷见就陷入了一个博弈。直观来看,最好的结果应该是二人都不认罪,警察也拿他们没办法。但是甲小偷想:如果自己选择了不认罪但乙选择了认罪,自己不就亏大了,于是他开始比较认罪和不认罪:

  • 如果乙不认罪,自己认罪可以当庭释放,不认罪会判刑半年,所以认罪更赚。
  • 如果乙认罪,自己认罪会判两年,而不认罪会判十年,所以认罪更赚。

综上所述,不管乙做出怎样的行为,自己认罪是最赚的,所以甲最后选择了认罪。而在另一件牢房里,乙也有着和甲一样的想法,于是,乙也选择了认罪。
最终,案件破获了,两个小偷都被绳之以法。两个小偷可以有更好的结果(都是半年刑),但他们都选择了认罪。这就是最基本的囚徒博弈了。
关于囚徒博弈更深层次的讨论(如多次选择或是二者有沟通)大家可以到相应的词条进行了解。


海盗博弈

在一艘等级森严的海盗船上,船员们发现了一箱财宝,里面有100个金币。大家都不知道怎么分配,于是海盗们达成了一个协议:按等级依次想一个分配方案,如果这个方案得到了半数或半数以上人的认可,就按这个方案执行;如果这个方案没有被通过,就把提出这个方案的人丢到海里去喂鲨鱼,然后下一级别的海盗接着出主意。为了简化问题,我们假设这艘船上只有五名海盗。
如果你作为一个海盗,你要怎样分配才能使自己得到最多的钱币而不被扔出船呢。我们现在假设,五名海盗分别为为海盗一、海盗二、海盗三、海盗四和海盗五,而他们的等级为
海盗一 > 海盗二 > 海盗三 > 海盗四 > 海盗五。
不妨我们倒着来讨论问题:

  • 如果只剩下海盗五,分配方案当然是自己独占,无人反对,通过;
  • 如果剩下海盗四和海盗五,海盗四提出方案自己独占,海盗五反对但海盗四支持,支持票占半数,通过;
  • 如果剩下海盗三、海盗四和海盗五,海盗三为了让海盗五投支持票,于是他选择给自己99个金币,给海盗五1个金币。对于海盗五来说,赞成这个决定会得到一金币,而如果不赞成,海盗三被扔下海,自己就得不到什么了,于是他选择支持,于是决定通过;
  • 如果剩下海盗二、三、四、五,海盗二就会给自己99金币给海盗四1金币,因为对于海盗四,如果不赞成这个决定,轮到海盗三时自己就什么都得不到了。这个决定两赞成两反对,通过;
  • 如果全员都在,以此类推,海盗一将会分给自己98枚金币,给海盗三和海盗五每人1金币。

所以我们列出表格:

分配\得到 海盗五 海盗四 海盗三 海盗二 海盗一 海盗一 1 0 1 0 98 海盗二 0 1 0 99 海盗三 1 0 99 海盗四 0 100 海盗五 100

于是我们就得出了分配的最好结果,以此类推。
同样也有相应的词条可以让大家进行更深的了解。


枪手博弈

三个西部枪手进行决斗。他们分别是甲、乙、丙。3他们的命中率都不同。甲的命中率只有30%,乙的命中率有80%,而丙是神枪手,百发百中。发射顺序是甲–>乙–>丙循环。你现在是甲,你有三个选择:射击乙射击丙,或是放空枪
现在,让我们来分析各个行为,并计算一下每个行为的生存率:

  • 放空枪:甲放弃了第一次射击机会,轮到乙射击,他一定会先去射击对自己有最大威胁的丙。如果丙死了,那么又轮到甲,这时甲乙只能互相射击,直到一方倒下。如果丙没死,轮到丙时丙一定会先放倒威胁较大的乙,而后甲有一次射击丙的机会,如果没有命中,那么甲就死了。甲的综合生存率:
    0.8×0.30.3+0.7×0.8+0.2×0.30.339
  • 射击乙:如果甲没有射死乙,那么又按照放空枪的程序进行射击,而如果甲射死了乙,也等于给自己判了死刑,丙百发百中的射击将会终结甲。此时甲的综合生存率:
    0.7×0.339+0.3×0=0.237
  • 射击丙:如果甲射死了丙,乙会对甲开枪,二者进行死战,而如果丙没死,之后流程与甲放空枪的流程一致。甲的生存率:
    0.3×0.2×0.30.2×0.3+0.8+0.7×0.339=0.258

所以,通过比较,放空枪其实是最好的策略。

这就是三个简单的博弈例子。希望大家从中可以得到一些经验,如果大家对博弈产生了兴趣,可以自行查阅书籍或网站对博弈进行进一步的了解。


  1. 解释参考自搜狗百科 ↩
  2. 一般又叫做囚徒困境。 ↩
  3. 这三个人也可以叫做:你的麦克雷,欧洲人的麦克雷,ie3.0的麦克雷。 ↩
0 0
原创粉丝点击