maximum likelihood estimation( 极大似然估计 ) - 有完整数据的参数估计

来源:互联网 发布:最穷的时候知乎 编辑:程序博客网 时间:2024/06/07 04:08

极大似然估计


mongoo

2013-09-25


  S 小城镇只有 A, B 俩咖啡店. A, B 俩咖啡店只卖'焦糖玛奇朵'和'卡布奇诺'两种. 且并不接受订单, 随机给出一杯咖啡. 小明刚来到 S 小城镇, 

想喝'卡布奇诺', 你会推荐他去哪一家店?

曾有人想摸透 A, B两家店给出 '卡布奇诺'的概率, 召集了9个朋友一起轮班去两家喝咖啡, 并给出了以下7组数据 

序号店铺喝到'卡布奇诺'人数1A92B53A64A85B36A97B4

他们已经喝不动了. 这时有人提出这样一个结论去 A 店随机给出一杯'卡布奇诺'的概率高.

一共去了A店4次. 一共喝到了 9 + 6 + 8 + 9 = 28杯 '卡布奇诺'  28/4 = 7, 所以在A店可以喝道 '卡布奇诺'的概率为 0.7

同理, B点可以喝道 '卡布奇诺'的概率为 0.4

所以他们推荐 小明去 A 点喝咖啡.


这个科学不?

我们以数学语言去描述这一件事请. 

首先, 我们使用变量 X 表示喝到'卡布奇诺'人数 Z 表示在哪个店铺喝的.




A,B 店随机给出 '卡布奇诺'的概率分别记为  和 .

我们的目标是通过这7组数据来估计 的数值.

有人提出 0.7, 0.4的概率可以这样描述:




其实, 实际上这样的估计就是 maximum likelihood estimation ( 极大似然估计 ).

上面的事件在概率统计上可以以  , 参数为  的 X,Z的联合概率分布来表示.

问题就变为, 求满足这样的 X,Z的 . 因为 X,Z 可以通过统计可得出, 如 .

可以写成关于  的函数: .

函数  叫做  的 likelihood function (似然函数). 


我们求对  的偏导并令偏导数为0,


可以得出


个人理解: 

此题为例, 观察可得X,Z. 想要找出 ( 在A,B店喝到 '卡布奇诺'的概率 ), 且与X,Z之间有联系. 

于是假设出一个函数  , 且找出使  值最大的 .

为什么  要求使其最大, 这是为什么呢?

先来看一下  具体表达意义何在.

 描述    : "在A,B店中喝到 '卡布奇诺'的概率", 

 描述: "在A,B店中喝到 '卡布奇诺'的概率为 的概率".

但事件2 为"真实事件", 即概率为1. 所以  越大, 越真实.

所以求满足  最大的 .

: likelihood function, 似然函数, 也是为一个已发生的真实事件的发生的概率函数.

因为投掷硬币中, 若投掷2次, 都出现正面. 则投掷硬币出现正面的  使其最大的  为 1. 即 .

所以极大似然估计描述已发生的真实事件的发生的概率函数,对于样本大小依赖很大.


到此, 本文结束. 

具体计算似然函数求偏倒为0, 看分割线之后部分.

=======================华丽的分割线=======================


有人会想计算验证, 可乍一看肯麻烦 ( 像我数学功底不好的同学 ), 好那举一个例子来计算一下, 验证上面计算所得确实是一样.

为了简化式子, 这伙人一家只去了一次, 如下

序号店铺喝到'卡布奇诺'人数1A92B5

则, 



即A, B 两家店喝到 '卡布奇诺'的概率各为 0.9, 0.5


得  , 同理