博弈论学习笔记(二)
来源:互联网 发布:好搜小说软件 编辑:程序博客网 时间:2024/06/03 09:12
当前部分主要集中在非合作博弈部分。
静态博弈是指:参与人同事选择行动,并不知道对方将要采取何种行动;
动态博弈是指:参与人的行动有先后顺序,且后者能够观察到先行动者所选择的行动。
完全信息:博弈过程中每一个位参与人对其他参与人的特征,策略空间及收益函数有准确的信息。
不完全信息:如果参与人对其他参与人的一些信息不准确知道。
根据以上两个属性方面,以及每个方面的两个属性取值,对应有四种组合结果。这就构成了大部分博弈论教材的章节分类方法。由最简单的完全静态博弈到最后的不完全动态博弈。每种组合结果,都有其最核心的均衡概念,相应的列在下方的表格中。
第一章
完全信息静态博弈
博弈问题的描述主要 有两种方式
1策略式:对静态问题的首选。
2扩展式:显示动态过程的逻辑,理解起来直观。
基本概念及表达式
参与人N,可以包括很多,从1 到 i
战略空间 每个人的策略集合用s,表示,si表示第i个人的一个策略。Si表示i 人所有的策略组成的策略空间。
u表示支付函数或者效用函数。ui表示某一个策略组合下,i人的效用或者支付或者盈利
占优均衡
非合作博弈中,参与人以自己的效用为唯一的衡量准则。
上策:参与人i 有一个策略,在这个策略下,其收益比选择其他策略有优势,而且当其他参与人做出任何选择时,参与人i 都存在这种优势。这种优势称为参与人i的上策。
占优均衡:如果每个参与人都上策,那么这个战略组合就称为占优均衡。
比如如下的囚徒困境
行 代表参与人1 列 代表参与人2
对于以上的囚徒困境中,达到合作共赢是不可能的,从自身收益角度考虑,如果对方选择合作,你选不合作比合作好,如果对方选择不合作,你选择不合作也比合作好,所以,你会选择不合作。这样对方也会得出和你一样的分析,那么 不合作 不合作,不合作是每个人的上策, 彼此都不合作构成了此时的占优均衡。
劣策略反复消去均衡
如果某种策略在任何情况下,收益都不会高于另一策略的收益,那么这一策略就称为劣策略。
通过反复消除劣策略,可以最终得到最终的消去均衡。消去过程可能不同,但是最终的结果是一样的。最后的得到的博弈不一定是占优均衡,但是如果博弈中存在占优均衡,那么一定是。
在删除劣策略保留好策略的过程中,也可以认为我们保留好的策略来代表劣策略。
纳什均衡
用公式描述不太好写出来。最核心的本质:任何参与人单方面偏离均衡不会带来收益的增加。只要某个参与人存在更好的策略,就意味着该策略组合不是纳什均衡。
划线法求解纳什均衡
在策略式表示的矩阵中按照行或者列,在参与人的最大效用下划线,得到两个数字下都有横线的组合,则为纳什均衡。如果,没有则说明纳什均衡不存在。
库诺特竞争模型
该模型主要用了求偏导数的方法来求解极值。
反应函数:
一个参与者的最优策略对另个参与者的策略的函数,可以用反应函数来描述。
对于两个参与者来说,彼此的反应函数的相交点就是纳什均衡点。
混合策略
把纯策略比喻成向量中的基底,也就是各个方向沿着坐标轴的单位向量,那么混合策略就是用这些基底构成的n维坐标系中的点。
到目前位置涉及的知识全部属于完全信息静态博弈,所用数学知识最高深也就是偏导数求极值。
若有疑问之处,欢迎留言交流~~
参考资料:
吴广谋 吕周洋 《博弈论基础与应用》 东南大学出版社 2009.3
- 博弈论学习笔记(二)
- 博弈论学习笔记(一)
- 博弈论学习笔记1
- 博弈论学习笔记2
- 博弈论学习笔记3
- 博弈论学习笔记4
- 博弈论学习笔记
- 博弈论学习笔记
- 博弈论学习笔记
- 博弈论(二)
- 组合游戏/博弈论学习笔记
- 博弈论学习总结(一)
- 博弈论学习记录(一)
- 博弈论笔记
- 博弈论学习
- 博弈论(二):Sprague-Grundy函数
- 博弈论(二):Sprague-Grundy函数
- 博弈论(二):Sprague-Grundy函数
- 贪心算法-nyoj-91-阶乘之和
- 嵌入式系统学习——S3C2451之RTC时钟
- 启动tomcat,提示: Several ports (8005, 8080, 8009) required by Tomcat v8.0 Server at local
- Poj 1339 poker card game (哈夫曼树)
- vim退出快捷键
- 博弈论学习笔记(二)
- layui源码详细分析系列之模块加载机制
- 算法系列——Permutations II
- Gerrit+Nginx
- 链表面试题之链表逆置、指定前k个逆置
- 程序是what?
- js选择结构
- PAT乙级 1062. 最简分数(20)--简单易错注意细节
- LingCode Range Sum Query 2D