4.4 博弈论

来源：互联网发布：一个ip多个域名 nginx 编辑：程序博客网时间：2024/05/22 06:37

博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。表面上不同的相互作用可能表现出相似的激励结构（incentive structure），所以他们是同一个游戏的特例。其中一个有名有趣的应用例子是囚徒困境。

具有竞争或对抗性质的行为称为博弈行为。在这类行为中，参加斗争或竞争的各方各自具有不同的目标或利益。为了达到各自的目标和利益，各方必须考虑对手的各种可能的行动方案，并力图选取对自己最为有利或最为合理的方案。比如日常生活中的下棋，打牌等。博弈论就是研究博弈行为中斗争各方是否存在着最合理的行为方案，以及如何找到这个合理的行为方案的数学理论和方法。

4.4.1 经典的囚徒困境

1950年，由就职于兰德公司的梅里尔·弗勒德（Merrill Flood）和梅尔文·德雷希尔（MelvinDresher）拟定出相关困境的理论，后来由顾问艾伯特·塔克（Albert Tucker）以囚徒方式阐述，并命名为“囚徒困境”。经典的囚徒困境如下：

警方逮捕甲、乙两名嫌疑犯，但没有足够证据指控二人有罪。于是警方分开囚禁嫌疑犯，分别和二人见面，并向双方提供以下相同的选择：

若一人认罪并作证检控对方（相关术语称“背叛”对方），而对方保持沉默，此人将即时获释，沉默者将判监10年。

若二人都保持沉默（相关术语称互相“合作”），则二人同样判监半年。

若二人都互相检举（互相“背叛”），则二人同样判监2年。

用表格概述如下：

甲沉默（合作）

甲认罪（背叛）

乙沉默（合作）

二人同服刑半年

甲即时获释；乙服刑10年

乙认罪（背叛）

甲服刑10年；乙即时获释

二人同服刑2年

若对方沉默、我背叛会让我获释，所以会选择背叛。

若对方背叛指控我，我也要指控对方才能得到较低的刑期，所以也是会选择背叛。

二人面对的情况一样，所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此，这场博弈中唯一可能达到的纳什均衡，就是双方参与者都背叛对方，结果二人同样服刑2年。

这场博弈的纳什均衡，显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言，如果两个参与者都合作保持沉默，两人都只会被判刑半年，总体利益更高，结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设，二人均为理性的个人，且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛，结果二人判监均比合作为高，总体利益较合作为低。这就是“困境”所在。例子有效地证明了：非零和博弈中，帕累托最优和纳什均衡是互相冲突的。

4.4.2 科斯定理与博弈论

关于：“非零和博弈中，帕累托最优和纳什均衡是互相冲突的。”不知道这句话是不是博弈论要得到的结论，所以我尝试以科斯定理的例子加以验证。

以牛吃小麦的案例为例，当牛吃麦子的交易费用为零，均衡点为A点，种麦者与养牛者这个系统所创造的利润为OAFO所包围的面积。

当牛吃麦子有交易费用，假设交易费用固定的话，且交易费用索取权归种麦者，等优曲线还是f₁，因为固定的费用会在求导时消除而成为等优曲线f₁。所以均衡点与无交易费用时的均衡点是相同的，都是A点，只是种麦者与养牛者这个系统所创造的利润要减少，减少量为固定的交易费用。

当牛吃麦子有交易费用，假设交易费用不固定，交易费用与牛吃麦子的重量成正比p₃，且交易费用索取权归种麦者，等优曲线变为f₁₀，此时均衡点为F点，未达到固定交易费用时的帕累托点A。

如果将均衡点F所需要付出的交易费用作为固定的交易费用，那么均衡点不再是F点，而会达到A点的帕累托最优。所以即使交易费用是相同的，交易费用的衡量方式也会影响资源的配置。

4.4 <wbr>博弈论

在牛吃麦子的例子中，种麦者与养牛者所组成的系统所创造的的利润要比牛不吃麦子时创造的多，是不是这个系统是非零和系统？而在交易费用固定时，是可以达到帕累托最优，在交易费用不固定时，不能达到帕累托最优。

那么博弈论的结论：“非零和博弈中，帕累托最优和纳什均衡是互相冲突的。”是不是就是有错误的，因为在非零和博弈中，交易费用固定时，可以达到帕累托最优？

在战争和企业管理中也存在着很多博弈，比如两家生产相同产品企业的竞争就是博弈，他们通过竞争可能使整个市场扩大，增加了双方的利润，比如可口可乐和百事可乐的竞争增加了可乐市场的总容量，使双方都获益；也可能通过价格竞争都达到利润的最大值，也可能因为彼此竞争降价而进入恶性价格战，导致双方利润减少，甚至破产，参见管理学通论价格战那节。

阅读全文

0 0

4.4&nbsp;博弈论

4.4.1 经典的囚徒困境

4.4.2 科斯定理与博弈论

4.4 博弈论