MLE、MAP、Bayies估计

来源:互联网 发布:通科商务营销软件 编辑:程序博客网 时间:2024/05/23 19:17

reference:

http://blog.sina.com.cn/s/blog_620b4cae0102vu02.html

http://www.cnblogs.com/sylvanas2012/p/5058065.html

最大似然估计MLE:给定一堆数据,假如我们知道它是从某一种分布中随机取出来的,可是我们并不知道这个分布具体的参即“模型已定,参数未知”把待估计参数θ看成确定性的量(只是值未知)通过使观测样本概率P(X|θ)最大的参数θ作为最佳估计参数。用数学公式表示即为使P(X|θ)最大的θ,其中X为观测样本,θ为参数。特点是简单实用,尤其是当样本多时能很好地逼近最佳近似。MLE的目标是找出一组参数,使得模型产生出观测数据的概率最大. 频率学派. pLSA EM Kmeans


贝叶斯估计:贝叶斯学派. 认为待估参数θ也是随机的变量,因为参数不能确定,所以输入X,并不能得到一个确定的θ。必须用概率的方式表达出来,所以贝叶斯估计是预测值的期望值。对样本观测的过程就是将先验概率密度转化为后验概率密度,这样就利用了样本的信息对参数的初始估计值。典型的效果就是没得到新的样本,都使得后验概率密度函数更加尖锐。使其在最佳估计参数附近形成一个峰值,这个现象称为贝叶斯学习过程。

P(θ|X)=P(X|θ)*P(θ)/P(X)    但通常P(X)需要对所有的参数进行积分,不能找到典型的闭合解。在这种情况下,我们采用了一种近似的方法求后验概率,这就是最大后验概率MAP。θ_MAP=argmaxθ(P(X|θ)*P(θ)). LDA

最大后验概率和极大似然估计很像,只是多了一项先验分布P(θ),它体现了贝叶斯认为参数θ也是随机变量的观点,在实际运算中通常通过超参数给出先验分布。从以上可以看出,一方面,极大似然估计和最大后验概率都是参数θ的点估计。在频率学派中,参数θ固定了,预测值也就固定了。最大后验概率是贝叶斯学派的一种近似手段,因为完全贝叶斯估计不一定可行。另一方面,最大后验概率可以看作是对先验和MLE的一种折衷,如果数据量足够大,最大后验概率和最大似然估计趋向于一致,如果数据为0,最大后验仅由先验决定。



0 0
原创粉丝点击