最大似然估计

来源:互联网 发布:网上开淘宝店要钱吗 编辑:程序博客网 时间:2024/05/22 17:31

原文地址:http://blog.csdn.net/angel_yuaner/article/details/47833337

最大似然估计是对概率密度函数的一种参数估计。就是说,样本的概率密度函数形式是已知的,但是函数中的某些或全部的参数未知,我们需要根据样本来估计这些参数的值。

一、最大似然估计的基本原理 
我们首先做以下的基本假设:

  1. 记待估计的参数为θ,这个量不是随机变量,而是确定的值,只是我们还不知道是多少而已;
  2. 将每类的样本集记作χi,i=1,2,...,c。其中每个样本都满足独立同分布;
  3. 类条件概率密度p(x|wi)的函数形式是确定的,就是说我们知道这些变量是服从什么分布,这样才知道是要求哪些未知参数。为了强调θ是待估计的参数,我们将p(x|wi)写作p(x|wi,θ)p(x|θ)
  4. 不同类别的参数也是独立的,各类样本只包含本类的分布信息,这样才可以分别对每一类单独处理。每一类的参数θi都是独立的,这样我们就可以将c个类别的估计分成c个独立的问题来处理。

设:样本集包含了N个样本,即: 

χ={x1,x2,,xN}

获得这个样本集的概率就是各个样本的联合概率: 
l(θ)=p(χ|θ)=p(x1,x2,,xN|θ)=i=1Np(xi|θ)

公式(1)反应了这概率密度函数的参数是θ时,得到样本χ的概率,称作参数θ相对于样本集χ似然函数,而乘积中的每一项p(xi|θ)就是θ相对于每一个样本的似然函数

现在我们来看,我们从一次抽样中得到的N个样本,我们想要知道这组样本“最可能”来自哪个密度函数;换句话说,所抽取的样本来自哪个密度函数(θ取什么值)的可能性最大?所以我们要的θ是使似然函数l(θ)最大的那个θ值,因为这组样本最可能来自这个密度函数。我们将这样的参数记作θ^θ^叫做θ最大似然估计

定义:l(θ)是样本集χ的似然函数,χ={x1,x2,,xN},如果θ^=d(χ)=d(x1,x2,,xN)是参数空间Θ中能使似然函数l(θ)极大化的θ值,则θ^就是θ最大似然估计量,记作: 

θ^=argmaxl(θ)

为了便于分析计算,经常对似然函数做对数,定义对数极大似然函数: 
H(θ)=lnl(θ)=lni=1Np(xi|θ)=i=1Nlnp(xi|θ)

可以证明,使对数似然函数最大的θ值同样也使似然函数最大。

二、最大似然估计的计算求解 
(1)但θ是一维的,即只有一个待估计的参数,通过解下列方程即可获得θ的值: 

dl(θ)dθ=0dH(θ)dθ=0

(2)但θ=[θ1,,θs]T是由多个未知参数组成的向量时,需要先对θ的每一维分别求偏导: 
θ=[θ1,,θs]T

并令其梯度等于0: 
θl(θ)=0

或对其对数似然函数计算: 
θH(θ)=i=1Nθlnp(xi|θ)

由此可以得到s个方程,方程组的解就是对数似然函数的极值点。在某些情况下极值点可能会有多个,但只有使似然函数最大的解才是最大似然估计值。
原创粉丝点击