详解最大似然估计(MLE)、最大后验概率估计(MAP),以及贝叶斯公式的理解
来源:互联网 发布:仙剑传奇网站源码 编辑:程序博客网 时间:2024/05/16 08:09
声明:本文为原创文章,发表于nebulaf91的csdn博客。欢迎转载,但请务必保留本信息,注明文章出处。
本文作者: nebulaf91
本文原始地址:http://blog.csdn.net/u011508640/article/details/72815981
最大似然估计(Maximum likelihood estimation, 简称MLE)和最大后验概率估计(Maximum a posteriori estimation, 简称MAP)是很常用的两种参数估计方法,如果不理解这两种方法的思路,很容易弄混它们。下文将详细说明MLE和MAP的思路与区别。
但别急,我们先从概率和统计的区别讲起。
概率和统计是一个东西吗?
概率(probabilty)和统计(statistics)看似两个相近的概念,其实研究的问题刚好相反。
概率研究的问题是,已知一个模型和参数,怎么去预测这个模型产生的结果的特性(例如均值,方差,协方差等等)。 举个例子,我想研究怎么养猪(模型是猪),我选好了想养的品种、喂养方式、猪棚的设计等等(选择参数),我想知道我养出来的猪大概能有多肥,肉质怎么样(预测结果)。
统计研究的问题则相反。统计是,有一堆数据,要利用这堆数据去预测模型和参数。仍以猪为例。现在我买到了一堆肉,通过观察和判断,我确定这是猪肉(这就确定了模型。在实际研究中,也是通过观察数据推测模型是/像高斯分布的、指数分布的、拉普拉斯分布的等等),然后,可以进一步研究,判定这猪的品种、这是圈养猪还是跑山猪还是网易猪,等等(推测模型参数)。
一句话总结:概率是已知模型和参数,推数据。统计是已知数据,推模型和参数。
显然,本文解释的MLE和MAP都是统计领域的问题。它们都是用来推测参数的方法。为什么会存在着两种不同方法呢? 这需要理解贝叶斯思想。我们来看看贝叶斯公式。
贝叶斯公式到底在说什么?
学习机器学习和模式识别的人一定都听过贝叶斯公式(Bayes’ Theorem):
贝叶斯公式看起来很简单,无非是倒了倒条件概率和联合概率的公式。
把B展开,可以写成:
这个式子就很有意思了。
想想这个情况。一辆汽车(或者电瓶车)的警报响了,你通常是什么反应?有小偷?撞车了? 不。。 你通常什么反应都没有。因为汽车警报响一响实在是太正常了!每天都要发生好多次。本来,汽车警报设置的功能是,出现了异常情况,需要人关注。然而,由于虚警实在是太多,人们渐渐不相信警报的功能了。
贝叶斯公式就是在描述,你有多大把握能相信一件证据?(how much you can trust the evidence)
我们假设响警报的目的就是想说汽车被砸了。把A计作“汽车被砸了”,B计作“警报响了”,带进贝叶斯公式里看。我们想求等式左边发生
可能有点绕,请稍稍想一想。
再思考【式2】。想让
从这个角度总结贝叶斯公式:做判断的时候,要考虑所有的因素。 老板骂你,不一定是你把什么工作搞砸了,可能只是他今天出门前和太太吵了一架。
再思考【式2】。观察【式2】右边的分子,
从这个角度思考贝叶斯公式:一个本来就难以发生的事情,就算出现某个证据和他强烈相关,也要谨慎。证据很可能来自别的虽然不是很相关,但发生概率较高的事情。 发现刚才写的代码编译报错,可是我今天状态特别好,这语言我也很熟悉,犯错的概率很低。因此觉得是编译器出错了。 ————别,还是先再检查下自己的代码吧。
好了好了,说了这么多,下面言归正传,说一说MLE。
——————不行,还得先说似然函数(likelihood function)
似然函数
似然(likelihood)这个词其实和概率(probability)是差不多的意思,Colins字典这么解释:The likelihood of something happening is how likely it is to happen. 你把likelihood换成probability,这解释也读得通。但是在统计里面,似然函数和概率函数却是两个不同的概念(其实也很相近就是了)。
对于这个函数:
输入有两个:x表示某一个具体的数据;
如果
如果
这有点像“一菜两吃”的意思。其实这样的形式我们以前也不是没遇到过。例如,
这么说应该清楚了吧? 如果还没讲清楚,别急,下文会有具体例子。
现在真要先讲讲MLE了。。
最大似然估计(MLE)
假设有一个造币厂生产某种硬币,现在我们拿到了一枚这种硬币,想试试这硬币是不是均匀的。即想知道抛这枚硬币,正反面出现的概率(记为
这是一个统计问题,回想一下,解决统计问题需要什么? 数据!
于是我们拿这枚硬币抛了10次,得到的数据(
那么,出现实验结果
注意,这是个只关于
可以看出,在
这样,我们已经完成了对
且慢,一些人可能会说,硬币一般都是均匀的啊! 就算你做实验发现结果是“反正正正正反正正正反”,我也不信
这里就包含了贝叶斯学派的思想了——要考虑先验概率。 为此,引入了最大后验概率估计。
最大后验概率估计
最大似然估计是求参数
MAP其实是在最大化
对于投硬币的例子来看,我们认为(”先验地知道“)
则
注意,此时函数取最大值时,
最后,那要怎样才能说服一个贝叶斯派相信
如果做了1000次实验,其中700次都是正面向上,这时似然函数为:
如果仍然假设
在
这样,就算一个考虑了先验概率的贝叶斯派,也不得不承认得把
PS. 要是遇上了顽固的贝叶斯派,认为
最大似然估计和最大后验概率估计的区别
相信读完上文,MLE和MAP的区别应该是很清楚的了。MAP就是多个作为因子的先验概率
如果有说错的或者没说清楚的地方,欢迎留言指教!如果您更好的见解,也欢迎留言交流!
谢谢阅读!
作者: nebulaf91
- 详解最大似然估计(MLE)、最大后验概率估计(MAP),以及贝叶斯公式的理解
- 最大似然估计(MLE)和最大后验概率估计(MAP)
- 最大似然估计(MLE)和最大后验概率(MAP)
- 最大似然估计(MLE)和最大后验概率(MAP)
- 最大似然估计(MLE) 最大后验概率(MAP)
- 最大似然估计 (MLE) 最大后验概率(MAP)
- 最大似然估计(MLE)和最大后验概率(MAP)
- 最大似然估计(MLE)和最大后验概率(MAP)
- 最大似然估计(MLE)和最大后验概率(MAP)
- 最大似然估计 (MLE) 最大后验概率(MAP)
- 最大似然估计(MLE)和最大后验概率(MAP)
- 最大似然估计(MLE)和最大后验概率(MAP)
- 最大似然估计 (MLE) 最大后验概率(MAP)
- 最大似然估计 (MLE) 最大后验概率(MAP)
- 最大似然估计(MLE)和最大后验概率(MAP)
- 最大似然估计 (MLE) 最大后验概率(MAP)
- 最大似然估计 (MLE) 最大后验概率(MAP)
- 最大似然估计(MLE)和最大后验概率(MAP)
- Android 进程保活资料汇总与华为白名单那些事
- 慎用zoom属性
- android mvp模式讲解
- Thymeleaf【第一篇】 结合springmvc
- Spring4学习笔记(三):依赖注入的方式与细节
- 详解最大似然估计(MLE)、最大后验概率估计(MAP),以及贝叶斯公式的理解
- [Web]Jquery圆点的图片轮播
- File-OS(简单文件系统的实现)
- [leetcode]: 9. Palindrome Number
- i miss you
- sublime text3中中文件名显示为方框,如何解决?
- Kotlin Reference (二) idioms 一些常用方式
- 如何节省内存空间
- 蓝桥-BASIC-27-2n皇后问题