最大似然和最大后验的关系

来源:互联网 发布:java微信退款接口开发 编辑:程序博客网 时间:2024/05/21 01:46
学过概率论的都应该知道贝叶斯公式。贝叶斯准则的公式可以写成如下的形式:

其中x1-xI表示我输入的一串数据,theta代替的是生成模型的一系列参数。

等式左边表示的是后验概率:我给你一串数据x(在计算机视觉中通常称为特征),它们属于这个theta代表的模型的概率是多少(在计算机视觉里通常表示分类,属于某一类的概率是多少)。

等式右边,分子有两部分组成,第一部分连乘的表达式称为似然,第二部分称为先验。

似然通常是我们要学习出来的模型,也就是说我们有很多这样的x数据,我们要拟合出一个theta模型,使得我给定这样的模型,数据x尽可能都在这样的模型里。这一过程通常是我们所说的模型训练。

先验,也即先验知识,是事先我们会知道的一些经验。一个简单的例子比如摇筛子,会出现1-6这6个数,每个数出现的概率都是1/6,这就是先验概率。

至于为什么我没说分母的表达式,因为X是给出的数据,我们的关注点在于theta代表的模型,这时分母相当于常量,因此一般可以不考虑。

而最大似然估计也就是求似然的最大值:

也就是我给你若干数据x,你给我拟合出一个关于theta的概率模型,使得把每个x带入概率模型里计算概率输出乘积最大,最大也就是拟合的效果最好。

而最大后验概率也就是求后验概率最大值:

由于分母的表达式与theta无关,所以可以当作常量去掉,简化成:

可以看出来最大后验和最大似然的公式非常类似,实际上最大似然就是最大后验的一种特殊情况,只是没有提供先验信息而已。


最大似然:Maximum likelihood 简称ML
最大后验:Maximum a posteriori 简称MAP
所以以后看到这样的简称不要忘了是什么意思哦!

最后再补充一点:在计算机视觉里,求似然的过程通常就是我们所说的训练或者学习过程,而求后验概率的过程通常就是分类或者测试,也就是说我已经拟合好了模型,然后现在来了一串新的特征数据X,我要求这串X分别属于每一种模型(或者说每一种类别)的概率,哪个模型下的概率最大,那么就属于这一类。

贝叶斯理论在机器学习,计算机视觉中地位还是相当重的,上面这些是基础,还有更深的理论值得去探究,再见,LZ继续去学朴素贝叶斯了。

(以上纯属个人理解,初来乍到,难免会写错一些,欢迎指正。)

参考文献:
Computer vision:models,learning and inference.    Simon J.D. PrinceJuly 7,2012
http://www.computervisionmodels.com.

0 0
原创粉丝点击