Bayes定理与应用

来源:互联网 发布:武当七侠知乎 编辑:程序博客网 时间:2024/06/02 05:58
找了几篇文章。
http://www.ruanyifeng.com/blog/2011/08/bayesian_inference_part_one.html
http://www.ruanyifeng.com/blog/2011/08/bayesian_inference_part_two.html
https://www.zhihu.com/question/19725590   ## 这个用频率举例,容易理解
http://norvig.com/spell-correct.html   ## 一个简易的拼写检查Python版本

P(A|B) = P(B|A)*P(A) / P(B)

例子-01
看了这么多答案,怎么没有人提平行宇宙解释。我忘记是不是在《黑客与画家》中看到的了。容我在此复述一下。
假设有1000个平行宇宙,这些宇宙中时间同步前进。
这一天,管理员小王天起床,走到车间。此时有750个宇宙,这机器都是好的。而另有250个宇宙,机器是坏的。
但是在所有的宇宙中,小王都忘记检查机器了(100%忘记检查的人物设定),然后机器开工,生产了一个产品。
我们看这750个良好机器的宇宙中,有90%的宇宙,也就是675个宇宙,都产生了好产品,而75个宇宙,生产了坏的产品。
我们再看这250个故障机器的宇宙中,有30%的宇宙,也就是75个宇宙生产了好产品,有175个宇宙生产了坏产品。
在那些生产了好产品的宇宙中,小王此时才想起来检查机器。生产好产品的宇宙一共有675+75 = 750 个宇宙,其中675 个宇宙是良好机器的宇宙,另外75 个宇宙是故障机器的宇宙。

问,此时(生产了好产品时)发现故障机器的概率?
岂不是太简单。
75/750 = 0.1

例子-02
作者:罗朝辉
链接:https://www.zhihu.com/question/19725590/answer/32275564
来源:知乎
著作权归作者所有,转载请联系作者获得授权。

示例示例一:应当根据新情况更新先验概率

《决策与判断》第十二章中讲到人们都有保守主义情结,即使出现了新信息,也不愿意根据新信息来更新先验概率。用前面解释里面的话说就是:新信息是 B 事件不断发生,人们本应该根据这个信息去更新 A 事件发生的概率,但人们却更愿意固守之前估计的 A 事件发生的概率。


书中举了这样一个调查案例:

假设有两个各装了100个球的箱子,甲箱子中有70个红球,30个绿球,乙箱子中有30个红球,70个绿球。假设随机选择其中一个箱子,从中拿出一个球记下球色再放回原箱子,如此重复12次,记录得到8次红球,4次绿球。问题来了,你认为被选择的箱子是甲箱子的概率有多大?

调查结果显示,大部分人都低估了选择的是甲箱子的概率。根据贝叶斯定理,正确答案是96.7%。下面容我来详细分析解答。


刚开始选择甲乙两箱子的先验概率都是50%,因为是随机二选一(这是贝叶斯定理二选一的特殊形式)。即有:

P(甲) = 0.5, P(乙) = 1 - P(甲);

这时在拿出一个球是红球的情况下,我们就应该根据这个信息来更新选择的是甲箱子的先验概率:

P(甲|红球1) = P(红球|甲) × P(甲) / (P(红球|甲) × P(甲) + (P(红球|乙) × P(乙)))
P(红球|甲):甲箱子中拿到红球的概率
P(红球|乙):乙箱子中拿到红球的概率

因此在出现一个红球的情况下,选择的是甲箱子的先验概率就可被修正为:

P(甲|红球1) = 0.7 × 0.5 / (0.7 × 0.5 + 0.3 × 0.5) = 0.7

即在出现一个红球之后,甲乙箱子被选中的先验概率就被修正为:

P(甲) = 0.7, P(乙) = 1 - P(甲) = 0.3;

如此重复,直到经历8次红球修正(概率增加),4此绿球修正(概率减少)之后,选择的是甲箱子的概率为:96.7%。

从程序运行结果来看,很明显可以看到红球的出现是增加选择甲箱子的概率,而绿球则相反。

原创粉丝点击