最大似然估计

来源:互联网 发布:淘宝上的正品足球鞋店 编辑:程序博客网 时间:2024/05/16 17:01

假设随机投掷一枚图钉,投掷的结果为X,X为随机变量,取值为{0, 1}

随机变量X

X的取值 0 1 概率 θ 1θ

上述表格中仅有1个独立的参数θ

现在重复进行了6次实验,得到数据集D={1,0,1,1,0,1}

给定参数θ,数据集D发生的可能性为条件概率P(Dθ),称为θ的似然(likelihood),记作

L(θD)=P(Dθ)

D是已知的,θ是未知的,因此L(θD)是关于θ的函数

对于上述观测到的数据集D={1,0,1,1,0,1},当θ=0时,显然D是不可能发生的,即P(Dθ=0)=0,而当θ=13时,对应的观测数据集D是最“合理”的,即P(Dθ=13)的值最大,这就是最大似然估计,寻找一个最优的参数θ,使得L(θD)取最大值

θ=argmaxθL(θD)

设数据集Dm个样本组成,即D={D1,D2,...,Dm},在最大似然估计中,需要做2个假设
假设1,各次实验相互独立,即P(Dθ)=m1P(Diθ)
假设2,每个样本Di的条件概率P(Diθ)相同,即P(Di=0θ)=θP(Di=1θ)=1θ
上述2个假设统称为独立同分布(i.i.d)

0 0