统计思维(实例7)——估计

来源:互联网 发布:互质的性质 知乎 编辑:程序博客网 时间:2024/05/30 23:37

估计游戏

想一个分布,猜这个分布是什么?两个提示:这是一个正态分布,分布的随机样本如下:
[-0.441, 1.774, -0.101, -1.138, 2.975, -2.138]
猜这个分布的均值μ是多少?


一个方法是使用样本均值x作为μ的估计。在上例中,x为0.155,因此合理的猜测是μ=0.155。这个过程称为估计(estimation),使用的统计量(样本均值)称为估计量(estimator)。


再想一个分布,这是个正态分布,一位调查员收集了这个分布的一个样本,但会把小数点写错位置,他收集的样本如下:
[-0.441, 1.774, -0.101, -1.138, 2.975, -213.8]
现在该如何估计μ?如果使用样本均值,估计值会是-35.12。使用样本均值估计是最好的方法吗,还有其他方法吗?


一种方法是找出并去除离群值,然后计算剩余的样本均值;另一种方法是使用中位数作为估计量。使用哪种估计量,取决于具体情况及目标。


如果没有离群值,使用样本均值作为估计量能够使均方误差(mean squared error,MSE)最小,即

其中m为游戏次数,n是用于计算x的样本大小。

猜测方差

想一个分布,这是个正态分布,样本如下:
[-0.441, 1.774, -0.101, -1.138, 2.975, -2.138]
猜这个分布的σ2是多少?明显的方法是用样本方差S2作为估计量。


对于大样本,S2是不错的估计量;但对于小样本,S2通常比方差分布低很多。由于这个属性,人们将S2称为偏倚(biased)估计量。如果对于多次重复实验,一个估计量的预期误差总和为0,那么这个估计量就是无偏的(unbiased)。


幸好,还有一个简单统计量是σ2的无偏估计量:

至于为什么S2是偏倚的,而S2n-1是无偏的,请参考http://wikipedia.org/wiki/Bias_of_an_estimator


这个估计量的最大问题是,名字和符号用法不一致:名字是“样本方差”,既可以是S2,也可以是S2n-1,而二者都使用符号S2


均方误差和偏倚都属于长期属性,建立在估计游戏多次重复的基础上。但如果将一个估计量用于真实数据,只能进行一次估计。在这种情况下,说一个无偏没有任何意义。无偏是估计量的属性,不是某次估计的属性。

抽样分布

假设一位科学家在野生动物保护区研究大猩猩,想知道保护区中成年大猩猩的平均体重。我们可以测量9只大猩猩的体重作为样本,使用样本均值x来估计未知的总体均值μ。但这个估计值的准确性怎么样?由随机选择导致的估计变化称为抽样误差(sampling error)。


为了量化抽样误差,我们可以假定μσ的取值,模拟抽样过程,观察x如何变化。由于总体μσ的实际值未知,因此我们将使用估计值x和S。我们需要回答的问题是:如果μσ的实际值分别为90千克和7.5千克,在多次运行相同的实验后,估计均值x将如何变化?


在每次循环中,我们从具有给定参数的正态分布中选择n个值,计算样本均值x。代码进行1000次模拟过程,然后计算估计值分布的CDF,结果如下图所示:


图1 x的抽样分布及置信区间


抽样分布的均值与假定值μ非常接近,说明平均而言,这个实验产生了正确的结果。


通常用两种方法对抽样分布进行概括:

  • 标准误差(standard error,SE),度量预期估计值平均偏离实际值多少。

  • 置信区间(confidential interval,CI),包含抽样分布中指定比例的范围。


标准误差和标准差有一个区别:随着样本量的增加,标准误差会变小,而标准差则不变。


置信区间和标准误差只是量化了抽样误差,即由于只测量了总体中的部分成员而导致的误差。

指数分布

再想一个分布,样本如下:
[5.384, 4.493, 19.198, 6.122, 12.844]
猜这个分布的参数λ是多少?


通常,指数分布的均值是1/λ,那么,我们应该选择

L是λ一个估计量。当存在离群值是,x的健壮性不佳。我们可以选择基于样本中位数的估计量。指数分布的中位数是ln(2)/λ,我们可以定义一个估计量:

Lm=ln(2)/m

其中m是样本的中位数。


实际上,x就是指数分布均值1/λ的无偏估计量,而L却不是λ的无偏估计量。


参考文献:

    统计思维. Allen B.Downey. 金迎 译

原创粉丝点击