第六章 统计量及其抽样分布

来源:互联网 发布:word 字数统计 mac 编辑:程序博客网 时间:2024/05/16 05:55

1 统计量

统计量:由样本构造一个函数,不依赖任何参数
常用统计量:样本均值(X ¯  )、样本方差(S 2  )、样本变异系数(V=SX ¯   )、样本k阶距、样本k阶中心距、样本偏度、样本峰度
次序统计量:样本极差(最大值减最小值)
充分统计量:统计量加工过程中一点信息都不损失的统计量。判别定理:因子分解定理

2 由正态分布导出的几个重要分布

1 χ 2  分布

设随机变量X 1 X 2 ...,X n  相互独立,且X i (i1,2,...,n) 服从标准正态分布N(0,1) ,则它们的平方和 n i=1 X 2 i  服从自由度为n χ 2  分布。
E(χ 2 )=n;D(χ 2 )=2n 
χ 2  分布具有可加性,即若χ 2 1 χ 2 (n 1 ),χ 2 2 χ 2 (n 2 ) ,且独立,则
χ 1 1 +χ 2 2 χ 2 (n 1 )+χ 2 (n 2 ) 
χ 2  的密度函数如下图所示:
这里写图片描述

2 t 分布

设随机变量XN(0,1),Yχ 2 (n) ,且X Y 独立,则
t=XY/n − − − −     
称为t 分布,记为t(n) ,其中n 为自由度。
n2 时,t 分布的数学期望E(t)=0 
n3 时,t 分布的方差D(t)=nn2  
t 的密度函数如下图所示:
这里写图片描述

3 F 分布

设随机变量Y Z 相互独立,且Y Z 分别服从自由度为m n χ 2  分布,随机变量X 有如下表达式:
X=Y/mZ/n =nYmZ  
则称X 服从第一自由度为m ,第二自由度为n F 分布 ,记为F(m,n) 
E(X)=nn=2 ,n>2 
D(X)=2n 2 (m+n2)m(n2(n4)) ,n>4 
F 的密度函数如下图所示:
这里写图片描述
如果随机变量X 服从t(n) ,则X 2  服从F(1,n)的F 分布。这在回归分析的回归系数检验中有用。

3 样本均值的分布于中心极限定理

当总体分布为正态分布N(μ,σ 2 ) 时,则X ¯  的抽样分布仍为正态分布,期望为μ ,方差为σ 2 /n 。这说明用样本均值X ¯  去估计总体均值μ 时,平均来说没有偏差(无偏性);当n 越来越大时,X ¯  的散布程度越来越小,即用X ¯  估计mu 越来越准确。
实际情况中,总体的分布不总是正态分布或近似正态分布,此时X ¯  的分布也将取决于总体分布情况。——中心极限定理
中心极限定理:设从均值为μ 、方差为σ 2  (有限)的任意一个总体总抽取样本量为n 的样本,当n 充分大时,样本均值X ¯  的抽样分布近似服从为均值为μ 、方差为σ 2 /n 的正态分布。
注意:什么是当n充分大呢?大样本、小样本之间的区分并不是以样本容量大小来区分的。在样本容量固定的条件下所进行的统计推断、问题分析,不管样本容量有多大,都称为小样本问题,而在样本容量n—>∞的条件下所进行的统计推断、问题分析则称为大样本问题。一般统计学中的n≥30为大样本,n<30为小样本只是一直经验说法。

4 样本比例的抽样分布

如果在样本大小为n的样本中具有某一特征的个体数为X ,则样本比例用p 表示:p=X/n 
则可以用样本比例p 来估计总体比例π 
n 充分大时,p ^  的分布可用正态分布去逼近,此时,p ^  服从均值为π 、方差为π(1π)n  的正态分布,则
p ^ N(π,π(1π)n ) 

5 两个样本平均值之差的分布

X 1  ¯  是独立地抽自总体X 1 N(μ 1 ,σ 2 1 ) 的一个容量为n 1  的样本的均值,X 2  ¯  是独立地抽自总体X 1 N(μ 2 ,σ 2 2 ) 的一个容量为n 2  的样本的均值,则有
E(X 1 X 2 )=μ 1 μ 2  
D(X 1 X 2 )=σ 2 1 n 1  +σ 2 2 n 2   
如果两个总体均为正态分布,则X 1 X 2  也为正态分布;当n 1  n 2  比较大时,一般要求n130,n230 ,则X 1 X 2  的抽样分布不管总体分布如何均可用正态分布来近似。

6 关于样本方差的分布

1样本方差的分布

X 1 ,X 2 ,...,X n  为来自正态分布的样本,则可以推出:
设总体分布为N(μ,σ 2 ) 的正态分布,则样本方差S 2  的分布为:
(n1)S 2 /σ 2 χ 2 (n1) 

2 两个样本方差比的分布

X 1 ,X 2 ,...,X n 1   为来自正态总体N(μ 1 ,σ 2 1 ) 的一个样本,Y 1 ,Y 2 ,...,Y n 1   为来自正态总体N(μ 2 ,σ 2 2 ) 的一个样本,且X i  Y i  相互独立,则
S 2 x /S 2 y σ 2 1 /σ 2 2  =S 2 x /σ 2 1 S 2 y /σ 2 2  F(n 1 1,n 2 1) 

0 0