最大似然和最大后验的关系

来源：互联网发布：java微信退款接口开发编辑：程序博客网时间：2024/05/21 01:46

学过概率论的都应该知道贝叶斯公式。贝叶斯准则的公式可以写成如下的形式：

其中x1-xI表示我输入的一串数据，theta代替的是生成模型的一系列参数。

等式左边表示的是后验概率：我给你一串数据x（在计算机视觉中通常称为特征），它们属于这个theta代表的模型的概率是多少（在计算机视觉里通常表示分类，属于某一类的概率是多少）。

等式右边，分子有两部分组成，第一部分连乘的表达式称为似然，第二部分称为先验。

似然通常是我们要学习出来的模型，也就是说我们有很多这样的x数据，我们要拟合出一个theta模型，使得我给定这样的模型，数据x尽可能都在这样的模型里。这一过程通常是我们所说的模型训练。

先验，也即先验知识，是事先我们会知道的一些经验。一个简单的例子比如摇筛子，会出现1-6这6个数，每个数出现的概率都是1/6，这就是先验概率。

至于为什么我没说分母的表达式，因为X是给出的数据，我们的关注点在于theta代表的模型，这时分母相当于常量，因此一般可以不考虑。

而最大似然估计也就是求似然的最大值：

也就是我给你若干数据x，你给我拟合出一个关于theta的概率模型，使得把每个x带入概率模型里计算概率输出乘积最大，最大也就是拟合的效果最好。

而最大后验概率也就是求后验概率最大值：

由于分母的表达式与theta无关，所以可以当作常量去掉，简化成：

可以看出来最大后验和最大似然的公式非常类似，实际上最大似然就是最大后验的一种特殊情况，只是没有提供先验信息而已。

最大似然：Maximum likelihood 简称ML

最大后验：Maximum a posteriori 简称MAP

所以以后看到这样的简称不要忘了是什么意思哦！

最后再补充一点：在计算机视觉里，求似然的过程通常就是我们所说的训练或者学习过程，而求后验概率的过程通常就是分类或者测试，也就是说我已经拟合好了模型，然后现在来了一串新的特征数据X，我要求这串X分别属于每一种模型（或者说每一种类别）的概率，哪个模型下的概率最大，那么就属于这一类。

贝叶斯理论在机器学习，计算机视觉中地位还是相当重的，上面这些是基础，还有更深的理论值得去探究，再见，LZ继续去学朴素贝叶斯了。

（以上纯属个人理解，初来乍到，难免会写错一些，欢迎指正。）

参考文献：

Computer vision：models，learning and inference. Simon J.D. PrinceJuly 7，2012

http://www.computervisionmodels.com.

0 0