Yale开放课程博弈论20

来源:互联网 发布:电脑用什么优化软件好 编辑:程序博客网 时间:2024/06/01 22:23
20. 战争的消耗

今天讨论的博弈问题是:2个参与者,每个阶段每个参与者各自选择攻击或者退出(同时选择),当博弈中有一方退出则游戏结束。
好消息:如果另一方先退出,你将获得奖励V;
坏消息:每个阶段,如果参与者双方都攻击,每人都要付出代价C;(假设V > C)
为了使得游戏更有趣,我们加入一个条件:两人同时退出,他们都会得到0。

老师在同学们当中选择了三组同学进行实验,得到的结果是:
1. 双方早早退出
2. 一方攻击,一方退出
3. 双方持续攻击

为什么会出现双方持续攻击的情况?尽管获胜的奖励只有1美元,他们持续攻击的损失早已超过1美元,他们仍然选择持续攻击为了获得胜利的尊严。

在这个博弈中真正的成本是沉没成本,尽管每轮有很少的损失,积累下来会超过最终的奖金。

第一次世界大战的一个事例,为了法国和比利时北边的一小片土地,德国和其他同盟国的军队便与英国和法国等国的协约国军队对峙了相当长的时间。两方从1814年打到1818年,每年都有很多人从中丧生。
另外一个商业化的例子,两家公司为了争夺一小块市场,例如英国卫星广播公司对决天空电视。
另外一个类似的例子是贿赂竞赛(全新拍卖),假设两家为了争夺市场,都想签下另外一家公司,需要靠贿赂。他们给出的贿赂的钱是不会返还的。

这是消耗战。

消耗战一般会演变成一场持久的战争。甚至理性的参与者也会陷入这种消耗战。

我们先来分析只有两个阶段的情况:

 我们先找出小博弈的所有子博弈完美均衡,这里的子博弈是什么呢?就是第一局结束后的第二阶段的博弈。

Second Sub-game的收益矩阵(其中每一项都还要减去C,因为进入了这一阶段说明第一阶段双方都选择了攻击)

      f(2)     q(2)
F(2)     -C, -C     V, 0
Q(2)     0,V     0,0

找出其中的纳什均衡(pure strategy): (F, q)和 (Q, f)

现在我们带着这子博弈的两个均衡,返回到第一阶段
      f(1)     q(1)
F(1)     -C+X,-C+Y      V, 0
Q(1)     0,V     0,0
X:第二轮子博弈中A的收益(连续收益)
Y:第二轮淄博一中B的收益

X和Y有两组取值(0,V)和(V,0),我们可以找到纳什均衡为(F(1), q(1))和(Q(1), f(2))。
如果我知道我明天会赢,那我今天会选择攻击,也会赢。

现在我们来寻找子博弈的混合策略均衡,与之前的方法一样,假设B选择攻击的概率为p,则写出A的不同选择的收益:
A Fight: -c*p + v*((1-p)
A Quit: 0*p + 0*(1-p)
让两者相等,得到p = v/(v+c)。这和鹰鸽战争是一样的。

双方选择攻击的几率都是p*=v/(v+c),收益是0*p + 0*(1-p) -c*p + v*(1-p)=0。

将混合策略均衡下的收益作为连续收益带入第一阶段,第一阶段的收益矩阵与第二阶段的是一样的。
同样得到mixed SPE: [(p*, p*), (p*, p*)],期望收益是0。

攻击发生的可能性同奖金V成正比,与C成反比,且随代价的增加而减少。

现在我们考虑一个可能永远进行下去的博弈

当考虑第4503阶段时,沉没成本4503*C,把之后的博弈的期望收益看做延续价值(以混合策略来看是0),如果双方都选择攻击的话,双方的收益是-C+延续价值=-C,收益矩阵和上面的还是一样的,混合策略均衡也还是一样的。
0 0