极大似然估计

来源:互联网 发布:互联网金融模式数据 编辑:程序博客网 时间:2024/04/29 15:33

很长时间都知道极大似然估计这么个事,最令我头疼的时候是考研时,数学最后一题铁定是估计与假设检验,当时的策略就是背公式,能算出来就是胜利。然后到了研究生阶段,到处都能看到它的身影,由于不是数学专业出身,而且可能是上课听讲不认真等因素,对其一直是一知半解。在此我也只是说一下比较直白的理解,并不会摆很多公式。

首先,我们必须知道,统计理论里面的描述统计和推断统计。
描述统计,是我们从小就接触的,给你全部的数据,你给我算均值、方差等,你具有数据的全部信息,而我们需要用数据的一些特征来描述它,使其直观。
而推断统计下,我们并没有全部的数据,而我们想从这些能观察到的数据去推断所有数据的情况。

大数定理

假设我们有n个独立同分布的变量X1,X2,X3...Xn,可以假设它们都遵从分布 X,其平均值Z定义为Zn=X1+X2+X3..+Xnn,因为Xn为随机变量,所以Z也为随机变量,而期望值μ可以看作是对分布X而言,它是一个客观存在的,即对于所有Xn都有E(Xn)=μ.所以对于随机变量Z有E(Zn)=μ
所以我们由观测值算得的方差为V[Zn]=V[X1+X2+X3..+Xnn]=σ2n,当n趋近于无穷大时,方差为0(方差为0表示不含随机性,即平均值不会产生波动),平均值收敛于μ。这就是所谓的大叔定理,即我们通过观察值可以推断出期望值,前提是随机变量遵从i.i.d。(当然涉及到随机变量的东西都很恼火,所以说Xn的理解非常重要)

极大似然估计

首先要确定,我们要估计的是什么,我们用什么来估计。

我们用观测到的样本值来估计该分布的模型
因为我们可以假设实际观测值与真是分布相关,并且观测值取值随机所以得到的估计量也是随机。

其中,没有给出具体的函数形式的问题为非参数统计,期望值与方差不确定但遵循正太分布的问题为参数统计问题。这里可以理解为,是否给出一个分布的模型。

然后下面就要引出一个重要的东西
有限维数的向量值参数θ,而我们就是要通过X(已有的观测值)来估计它。之前之所以不理解极大似然估计等一些估计方法,就是不理解θ,就觉得莫名其妙为什么多了个参数给我。其实,θ就是决定模型的参数。在对正态分布模型进行估计时θ=μ,σ,对于其他非正态分布模型,也是其关键参数。

设数据X1,X2...Xn的测定值为x1,x2...xn
使该公式P(Xi=xi)概率最大化的参数θ就是最大似然估计,对这个地方的理解我觉得很重要,就是,我所估计的一个模型,需要最大可能性的表征(或者满足)我已测到的值。
这里我觉得用随机过程来描述比较好理解

然后就是对P(Xi=xi)求对数似然L(θ),通过对θ中各个参数求偏导因此可以得到满足P(Xi=xi)的参数θ,因此确定了分布模型。

0 0
原创粉丝点击