博弈论学习笔记(二)

来源:互联网 发布:好搜小说软件 编辑:程序博客网 时间:2024/06/03 09:12

当前部分主要集中在非合作博弈部分。

静态博弈是指:参与人同事选择行动,并不知道对方将要采取何种行动;

动态博弈是指:参与人的行动有先后顺序,且后者能够观察到先行动者所选择的行动。

完全信息:博弈过程中每一个位参与人对其他参与人的特征,策略空间及收益函数有准确的信息。

不完全信息:如果参与人对其他参与人的一些信息不准确知道。

根据以上两个属性方面,以及每个方面的两个属性取值,对应有四种组合结果。这就构成了大部分博弈论教材的章节分类方法。由最简单的完全静态博弈到最后的不完全动态博弈。每种组合结果,都有其最核心的均衡概念,相应的列在下方的表格中。

 静态动态完全信息纳什均衡子博弈精炼纳什均衡不完全信息贝叶斯纳什均衡精炼贝叶斯均衡


第一章

完全信息静态博弈

博弈问题的描述主要 有两种方式

1策略式:对静态问题的首选。

2扩展式:显示动态过程的逻辑,理解起来直观。


基本概念及表达式

参与人N,可以包括很多,从1 到 i

战略空间 每个人的策略集合用s,表示,si表示第i个人的一个策略。Si表示i 人所有的策略组成的策略空间。

u表示支付函数或者效用函数。ui表示某一个策略组合下,i人的效用或者支付或者盈利


占优均衡

非合作博弈中,参与人以自己的效用为唯一的衡量准则。

上策:参与人i 有一个策略,在这个策略下,其收益比选择其他策略有优势,而且当其他参与人做出任何选择时,参与人i 都存在这种优势。这种优势称为参与人i的上策。

占优均衡:如果每个参与人都上策,那么这个战略组合就称为占优均衡。

比如如下的囚徒困境

行 代表参与人1  列 代表参与人2

 合作不合作合作3 30 5不合作5 01 1

对于以上的囚徒困境中,达到合作共赢是不可能的,从自身收益角度考虑,如果对方选择合作,你选不合作比合作好,如果对方选择不合作,你选择不合作也比合作好,所以,你会选择不合作。这样对方也会得出和你一样的分析,那么 不合作  不合作,不合作是每个人的上策, 彼此都不合作构成了此时的占优均衡。

劣策略反复消去均衡

如果某种策略在任何情况下,收益都不会高于另一策略的收益,那么这一策略就称为劣策略。

通过反复消除劣策略,可以最终得到最终的消去均衡。消去过程可能不同,但是最终的结果是一样的。最后的得到的博弈不一定是占优均衡,但是如果博弈中存在占优均衡,那么一定是。 

在删除劣策略保留好策略的过程中,也可以认为我们保留好的策略来代表劣策略。

纳什均衡

用公式描述不太好写出来。最核心的本质:任何参与人单方面偏离均衡不会带来收益的增加。只要某个参与人存在更好的策略,就意味着该策略组合不是纳什均衡。

划线法求解纳什均衡

在策略式表示的矩阵中按照行或者列,在参与人的最大效用下划线,得到两个数字下都有横线的组合,则为纳什均衡。如果,没有则说明纳什均衡不存在。

库诺特竞争模型

该模型主要用了求偏导数的方法来求解极值。

反应函数:

一个参与者的最优策略对另个参与者的策略的函数,可以用反应函数来描述。

对于两个参与者来说,彼此的反应函数的相交点就是纳什均衡点。

混合策略

把纯策略比喻成向量中的基底,也就是各个方向沿着坐标轴的单位向量,那么混合策略就是用这些基底构成的n维坐标系中的点。

到目前位置涉及的知识全部属于完全信息静态博弈,所用数学知识最高深也就是偏导数求极值。

若有疑问之处,欢迎留言交流~~




参考资料:

吴广谋 吕周洋 《博弈论基础与应用》 东南大学出版社 2009.3

原创粉丝点击