最大似然估计

来源：互联网发布：网上开淘宝店要钱吗编辑：程序博客网时间：2024/05/22 17:31

原文地址：http://blog.csdn.net/angel_yuaner/article/details/47833337

最大似然估计是对概率密度函数的一种参数估计。就是说，样本的概率密度函数形式是已知的，但是函数中的某些或全部的参数未知，我们需要根据样本来估计这些参数的值。

一、最大似然估计的基本原理
我们首先做以下的基本假设：

记待估计的参数为θ，这个量不是随机变量，而是确定的值，只是我们还不知道是多少而已；
将每类的样本集记作χi,i=1,2,...,c。其中每个样本都满足独立同分布；
类条件概率密度p(x|wi)的函数形式是确定的，就是说我们知道这些变量是服从什么分布，这样才知道是要求哪些未知参数。为了强调θ是待估计的参数，我们将p(x|wi)写作p(x|wi,θ)或p(x|θ)
不同类别的参数也是独立的，各类样本只包含本类的分布信息，这样才可以分别对每一类单独处理。每一类的参数θi都是独立的，这样我们就可以将c个类别的估计分成c个独立的问题来处理。

设：样本集包含了N个样本，即：

χ = {x 1, x 2, \dots, x N}

获得这个样本集的概率就是各个样本的联合概率：

l (θ) = p (χ | θ) = p (x 1, x 2, \dots, x N | θ) = \prod i = 1 N p (x i | θ)

公式(1)反应了这概率密度函数的参数是θ时，得到样本χ的概率，称作参数θ相对于样本集χ的似然函数，而乘积中的每一项p(xi|θ)就是θ相对于每一个样本的似然函数。

现在我们来看，我们从一次抽样中得到的N个样本，我们想要知道这组样本“最可能”来自哪个密度函数；换句话说，所抽取的样本来自哪个密度函数（θ取什么值）的可能性最大？所以我们要的θ是使似然函数l(θ)最大的那个θ值，因为这组样本最可能来自这个密度函数。我们将这样的参数记作θ^，θ^叫做θ的最大似然估计。

定义：令l(θ)是样本集χ的似然函数，χ={x1,x2,…,xN}，如果θ^=d(χ)=d(x1,x2,…,xN)是参数空间Θ中能使似然函数l(θ)极大化的θ值，则θ^就是θ的最大似然估计量，记作：

θ^= a r g m a x l (θ)

为了便于分析计算，经常对似然函数做对数，定义对数极大似然函数：

H (θ) = ln l (θ) = ln \prod i = 1 N p (x i | θ) = \sum i = 1 N ln p (x i | θ)

可以证明，使对数似然函数最大的

θ值同样也使似然函数最大。

二、最大似然估计的计算求解
(1)但θ是一维的，即只有一个待估计的参数，通过解下列方程即可获得θ的值：

d l ( θ ) d θ = 0 或 d H ( θ ) d θ = 0

(2)但

θ=[θ1,…,θs]T是由多个未知参数组成的向量时，需要先对

θ的每一维分别求偏导：

\nabla θ = [\partial \partial θ 1, \dots, \partial \partial θ s] T

并令其梯度等于

0：

\nabla θ l (θ) = 0

或对其对数似然函数计算：

\nabla θ H (θ) = \sum i = 1 N \nabla θ ln p (x i | θ)

由此可以得到

s个方程，方程组的解就是对数似然函数的极值点。在某些情况下极值点可能会有多个，但只有使似然函数最大的解才是最大似然估计值。

阅读全文

0 0