Yale开放课程博弈论10
来源:互联网 发布:淘宝店铺负责人认证 编辑:程序博客网 时间:2024/05/21 15:45
首先回顾上一讲中Venus和Serena之间的博弈,但是上一讲我们并没有对得到的混合策略均衡进行证明。
从上一节前面提出的重要结论我们知道,混合策略纳什均衡中各个纯策略的收益是相等的。这样即不存在任何一个纯策略收益会严格优于目前的混合策略。而混合策略的收益又是各个纯策略的收益的平均,所以任何混合策略的收益相对于混合策略的纳什均衡都不会是严格有利的改变。也就是说,我们在检查混合策略的纳什均衡时只需要检查各个纯策略是否严格优于纳什均衡即可。
AP 1,2 0,0
REP 0,0 2,1
跟之前的例子一样,其实这个例子中也存在两个纯策略的纳什均衡,现在我们来看看混合策略的纳什均衡,跟上节课的计算方法一样,我们可以得到Davide (1/3, 2/3)和Nina (2/3, 1/3)。
该纳什均衡下的收益两者都是2/3。为什么收益会这么低?(选择纯策略的均衡时收益可以是1或者2)
因为选择纯策略时他们需要经过协商,均衡时肯定是约会成功的。而采用混合策略的时候,他们可能有时候没能见面,约会成功的概率为1/3*2/3+2/3*1/3 = 4/9。即超过一半的概率他们两个根本见不到面。
由收益来看这个混合策略的纳什均衡虽然是坏的均衡,但是更具有现实意义。
上节课的例子中我们都是把随机化理解为每个参与者随机选择各个策略的概率。而对于上面这个约会的例子为什么他们要随机化地选择呢?
这里关于理解随机化的一个重要结论,并不完全是随机化,而是对对方行为的信念的随机化,处于均衡时人们心中的某些信念。
接下来一个例子,填写税单Tax form,纳税人可以选择的策略为如实汇报H或者欺骗C, 而审计员可以选择审计A或者不审计N,假设同时决策。
这里将介绍关于随机化的第三种理解,把概率不看成随机化,而是看成总体选择某种策略的比例。
当增加偷税的惩罚措施,将偷税被抓的罚款由-10改为-20,纳税人的纳税意愿是上升、下降还是保持不变?
通过实际例子中计算新均衡下的q值,即考虑审计员的收益,我们得到的q保持不变。实际上审计员选择审计的p改变了,由2/7减少为1/6。即实际上该措施并没有提高纳税意愿。
为什么新的策略不起作用?是什么决定混合纳什均衡策略中纳税人的纳税意愿呢?
通过计算纳什均衡的过程,我们可以看到计算纳税人的混合策略的均衡中p的值时,我们利用的是审计员的收益。因为上例中没有改变审计员的收益,所以没有改变纳税人的纳税概率。
那么该如何立法来提升纳税意愿?
降低审计成本。
最后总结一下这节课的内容:
1. 三种解读方法:随机化、处于均衡时的某种信念、总体中的比例。
2. 检验均衡,只需要考虑所有的纯策略是否严格优于均衡的混合策略。
3. 根据混合策略均衡的原理,如果改变纵向的收益会改变横向的纳什均衡,反之亦然。
从上一节前面提出的重要结论我们知道,混合策略纳什均衡中各个纯策略的收益是相等的。这样即不存在任何一个纯策略收益会严格优于目前的混合策略。而混合策略的收益又是各个纯策略的收益的平均,所以任何混合策略的收益相对于混合策略的纳什均衡都不会是严格有利的改变。也就是说,我们在检查混合策略的纳什均衡时只需要检查各个纯策略是否严格优于纳什均衡即可。
接下来回到以前一个例子,上次讲协同博弈时举例为一男一女看电影(即性别战争Battle of sexes),在班上选择了两个同学David和Nina,这次继续这个游戏,不过他们要去摘苹果(AP)或者看戏(REP)
D\N AP REPAP 1,2 0,0
REP 0,0 2,1
跟之前的例子一样,其实这个例子中也存在两个纯策略的纳什均衡,现在我们来看看混合策略的纳什均衡,跟上节课的计算方法一样,我们可以得到Davide (1/3, 2/3)和Nina (2/3, 1/3)。
该纳什均衡下的收益两者都是2/3。为什么收益会这么低?(选择纯策略的均衡时收益可以是1或者2)
因为选择纯策略时他们需要经过协商,均衡时肯定是约会成功的。而采用混合策略的时候,他们可能有时候没能见面,约会成功的概率为1/3*2/3+2/3*1/3 = 4/9。即超过一半的概率他们两个根本见不到面。
由收益来看这个混合策略的纳什均衡虽然是坏的均衡,但是更具有现实意义。
上节课的例子中我们都是把随机化理解为每个参与者随机选择各个策略的概率。而对于上面这个约会的例子为什么他们要随机化地选择呢?
这里关于理解随机化的一个重要结论,并不完全是随机化,而是对对方行为的信念的随机化,处于均衡时人们心中的某些信念。
接下来一个例子,填写税单Tax form,纳税人可以选择的策略为如实汇报H或者欺骗C, 而审计员可以选择审计A或者不审计N,假设同时决策。
这里将介绍关于随机化的第三种理解,把概率不看成随机化,而是看成总体选择某种策略的比例。
当增加偷税的惩罚措施,将偷税被抓的罚款由-10改为-20,纳税人的纳税意愿是上升、下降还是保持不变?
通过实际例子中计算新均衡下的q值,即考虑审计员的收益,我们得到的q保持不变。实际上审计员选择审计的p改变了,由2/7减少为1/6。即实际上该措施并没有提高纳税意愿。
为什么新的策略不起作用?是什么决定混合纳什均衡策略中纳税人的纳税意愿呢?
通过计算纳什均衡的过程,我们可以看到计算纳税人的混合策略的均衡中p的值时,我们利用的是审计员的收益。因为上例中没有改变审计员的收益,所以没有改变纳税人的纳税概率。
那么该如何立法来提升纳税意愿?
降低审计成本。
最后总结一下这节课的内容:
1. 三种解读方法:随机化、处于均衡时的某种信念、总体中的比例。
2. 检验均衡,只需要考虑所有的纯策略是否严格优于均衡的混合策略。
3. 根据混合策略均衡的原理,如果改变纵向的收益会改变横向的纳什均衡,反之亦然。
0 0
- Yale开放课程博弈论10
- Yale开放课程博弈论2
- Yale开放课程博弈论3
- Yale开放课程博弈论4
- Yale开放课程博弈论5
- Yale开放课程博弈论6
- Yale开放课程博弈论7
- Yale开放课程博弈论8
- Yale开放课程博弈论9
- Yale开放课程博弈论11
- Yale开放课程博弈论12
- Yale开放课程博弈论13
- Yale开放课程博弈论14
- Yale开放课程博弈论15
- Yale开放课程博弈论16
- Yale开放课程博弈论17
- Yale开放课程博弈论18
- Yale开放课程博弈论19
- 在关于WIN8.1运行安装程序出现2203错误解决(IAR FOR STM8S)
- 创建Fragment
- LeetCode-Remove Duplicates from Sorted List II
- 网页开发的阶段总结(四)--JS与PHP之间大数据的传送
- 互联网入门知识
- Yale开放课程博弈论10
- python学习笔记
- 常见排序算法复杂度
- SharedPreferences
- [面试题]const与指针
- 买票问题
- 第十二次codeforces竞技结束 #263 Div 2
- 【LeetCode】Permutations
- 【已解决】C#将DLL嵌入到exe当中