【Model Thinking】L5 人类建模:电子思维 学习笔记

来源:互联网 发布:c语言switch例子 编辑:程序博客网 时间:2024/04/30 11:37

L5 Thinking Electrons:Modeling People

1 人类模型:电子思维

2 【理性行动者模型】 Rational Actor Models

3 【行为模型】 Behavioural Models

4 【基于规则的模型】 Rule based models

5 行为什么时候重要?When Does Behaviour Matters?


1 人类模型:电子思维

主要讨论为为人建模,涉及到个人或一群人的模型。

人是复杂的动物,有目标,有意图,有动地,有信念体系等等,各种结合在一起,多么复杂。

物理学家 默里-盖尔曼曾说过:

[想象一下,如果电子能够思考的话,那么物理学该有难啊!]

【人是会思考的,所以也就复杂了,这也正是奇妙的地方!这个世界上也存在着各种的心智,最主要的还是提高自己的心智,获得自己的定见,然后义无反顾地去见上帝吧。】

三种基础框架

  • 1 理性行为者模型(rational Actor model)
  • 2 行为模型(behaviour model)
  • 3 规则模型

【有时候不是简单的一种模型,因为认识复杂的,所以这些模型也是简化的结果,考虑多种的结合可能得到的各种迥异的结论。】
参考


2 【理性行动者模型】 Rational Actor Models

【假设】:人是理性的,我们做出最优化的选择。

2.1 【决定模式】——目标-优化模式

  • 目标 Objective ——你的(公司的)目标是什么,希望达到的期望是什么?获得多少利润,赚多少钱等等!自己的幸福感也是可以的。
  • 优化 optimize —— 如何基于上述的目标,做出最优化的选择
    【通过实际情况,建立简单的数学模型or方程,找到最优解】

【目标】

  • 公司:最大的利润
  • 个人:最高的效用,幸福度
  • 政治候选人:最高的选票
    【建立目标比较简单,难得是如何建立模型,尤其是其中的参数,这个是不大确定的,所以只能从现有的数据中来确定参数吧,和统计学有点关系】

【应用】

1、investments
2、Purchases
3、Education level
4、Vote
5、Number of Children(居然和要多少孩子也有关系)

【Note】

在假设理性的时候,人们经常认为它是自私的,但是并不正确。 理性可以是利他的,也可以是不理性而利他的。参考

2.2 博弈【game】

【前提】:独立性哦,人们之间不可以商量的。
在博弈论中,我的报酬取决于其他人做什么;
大部分博弈论的原理:【假定其他人是理性的】。

  • 【正则型博弈】例子:两人决定周末是待在家里还是去City
  • 【扩展型博弈(博弈树)】行动有先后顺序

    【注意:独立选择原则】

2.3 【为什么理性行为者模型有用】

  • 大风险情况:理性选择
  • repeat: 训练重复,最优,学习就是如此
  • 一群人做决定时:人越多,可能会产生不犹豫不决,但是越多人来帮助你,不理性决定的几率会小一些
  • 最优选择很容易做出时:人总是倾向于利益那一方面的。

2.4 Why 理性?

  • 1 大多情况下,理性行为得到一个独一无二的结果
  • 2、理性使事情容易解决
  • 3、人们通过学习来把事情做对,随着时间的推移,人们会向着理性的假定靠近;
  • 4、使人们会犯错,但如果方法上没有偏差,不同人这种或者那种错误都会抵消,平均说来,你得到的接近理性
    【生活中,想要成功,就需要自己的理性控制自己的情感,千万不要感情用事。】

3 【行为模型】 Behavioural Models

前景理论prospect theory

双曲贴现hyperbolic discount

维持现状偏见(status quo bias)

基础率偏差(base rate bias)

理性行为者模型的不足:

  • 1、Observation 通过从客观世界中直接观察和做实验,人们获得的许多观察结果和数据显示,人们似乎在决策中系统地偏离最佳选择;
  • 2、Neurotic 神经学的证据显示我们大脑的构造、我们如何编码和描述信息、我们思考的方式和理性行为者模型所假设的不同。

【前提】人们会犯错误(行为有偏差)

丹尼柯雷曼(Daniel Kahneman)因研究在经济学领域关于人们是如何系统性地偏离理性假设而获得了诺贝尔奖。他的书《思考:快与慢》
快:感情控制理性
慢:理性控制感情
【感情用事容易出错,理性做事,慢慢成功】

3.1 前景理论prospect theory

【例子1】收益

  • A:400刀
  • B:1000刀,50%;0刀,50%
    【在这个受收益面前,人们倾向于表现出风险规避risk averse行为,大多选A】

若将收益改为损失的话:

  • A:-400刀
  • B:-1000刀,50%;0刀,50%
    【在此种情况下,人大多选B。人在损失面前,更愿意冒险。】【理解被剥夺超级反应倾向】

3.2 双曲贴现hyperbolic discount:考虑到我们如何处理长远的事情

【例子】

  • A:1000刀立即得到
  • B:1005刀,明天才能得到
    【很多人选择A】
  • A:1000刀,1年后得到
  • B:1005刀,1年+1天后能得到
    【很多人选B】

参考

如果按照理性行为者模型我努力最大化我的财富,在这个问题中我会考虑折现率(discount rate)(源于货币的时间价值,今天的1元钱和未来的1元钱价值是不一样的,为了进行比较应该将t时间后的货币值M按折现率d进行“折现”,现值CV=M/(1+d)^t,建议参考金融学书籍),在这个问题里t都是1天,如果在第一种情况下选择了A,在第二种情况下,我也应该选择A。
但现实中,我们会存在“双曲贴现”的想法而产生偏差,即对同样的货币量,我们对近期的折现比对更远期的折现做得更多,如图,图上横轴上的时间差相同,但一个离现在较近,一个较远,因此产生的贴现率差别也是不一样的。所以,虽然多等一天都需要更多的钱来补偿,但需要更多的钱来补偿多等较近的一天,而一年以后多等一天则显得差别较小。
在双曲贴现下,人们会倾向于追求现时的享受。比如,问一个要减肥的人一周后会不会想不想吃一块巧克力蛋糕,回答可能是理性的不要;但如果放一块巧克力蛋糕在眼前问现在想不想吃,结果很可能不会拒绝。人们在“快思考”下会偏离最佳的选择。

3.3 维持现状偏见(status quo bias):我们倾向于继续我们正在做的,而不做改变。

【人类的避免痛苦的倾向,因为有时改变是痛苦的】

3.4 基础率偏差(base rate bias):我们受我们正在想的事情影响。

参考

基础率偏差就是如果你让人们想一个数字,然后问他们另一个事情,那个第二个数字会跟第一个很接近。例子:猜测这个盒子的价格和年份,很多人会写下相近的两个数字,比如60年制造、63美元。

【行为模型需要注意的几个问题:】

一、上面的例子大多是对发达国家的人进行的研究,但不同国家不同人群产生的偏差会有所不同,有些理论对不同国家的人都适用,有些则可能产生不同的结果。
二、由于人们会进行学习,比如之前学习的“三扇门”的例子,人们一开始可能在“维持现状偏差”作用下错误地坚持原先的选择,但玩这个游戏足够长以后,可能会消除偏差。所以,要考虑不断交互中的这种偏差到底有多强,他们会不会消失。
三、把各种偏差都考虑进一个模型里十分困难,所以应该从较为简单的理性假设开始,假设人会选择最优,设定一个简单的目标函数,然后选择最相关、作用最强的偏差加进模型,即采用理性,然后加进一点偏差。


4【基于规则的模型】 Rule based models

参考


5 行为什么时候重要?When Does Behaviour

参考


致谢

感谢 模型思维 课程团队, 感谢Scott老师
感谢文中用到的MOOC上面的小伙伴笔记

0 0
原创粉丝点击