数理统计

来源:互联网 发布:德兴软件ui设计师 编辑:程序博客网 时间:2024/05/18 00:42

当研究并解决一个实际问题时, 我们会
遇到下面问题:
• 1. 这个随机现象可以用什么样的分布律
来刻划,这种分布律的选用合理吗?
• 2. 所选用的这一分布律的参数是多少?
如何估计和确定这些参数?
如何利用数据资料,作出尽可能精确可
靠的统计结论(统计推断):
1) 估计——从局部观测资料的统计特征,推断总体的特征(分布与矩);
2)假设检验——依据抽样数据资料,对总体的某种假设作检验,从而决定对此假定是拒绝抑或接受.


数理统计的基本概念

总体:研究对象全体; 也称母体, 记作S.
样本:总体中抽出作观测的个体;也称子样,记ω
样本容量:抽取的个体数目;也称样本大小.

例子

随机抽5支,得寿命数据(称为观察[测]值):
725520683992742.(小时)
一般记为,x1 x2 x3 x4 x5.
又抽5支, x1 x2 x3 x4 x5.
再抽5支, x1 x2 x3 x4 x5 .
…… ……
如此继续. 各组观察值彼此不同.
如此继续. 每组中的第一支灯的寿命,
也彼此不同. 这样,泛指所抽取的第一支荧光灯的寿命应是一个rv,记为
X1 . 同样第二支的寿命是rv X2 ,…
如此得一组rv : X1,X2,X3,X4,X5
称为大小为5的样本.
一般地则有大小(容量)为n 的样本,称x1,x2,...,xn样本观察值[现实].
抽取的样本如能切实保证其随机性,那么应该彼此独立,且能反映总体的随机规律性,即所有样本彼此独立且与总体同分布. 这样的样本,我们称之为简单样本. 这种抽样方法,叫简单抽样.
注意,在有限总体中,各观察结果可能不独立.


样本的数字特征与分布

最简单又方便的样本函数g(X1,,Xn)Xi们的一次和二次的线性组合.
由于样本“平等”,线性组合中应有相等的权系数.

一次时:样本的算术平均值X¯¯¯;
二次时:中心化后的样本二阶中心矩S2n.
X1,,Xn为总体S的大小为n的样本, 分别称

X¯¯¯=1ni=1nXi    S2=1n1i=1n(XiX¯¯¯)2

样本均值*样本方差(样本方差除以n-1的原因),而依次称
Mk=1ni=1nXki    S2n=1ni=1n(XiX¯¯¯)2

样本的k阶矩样本的二阶中心矩.

记号:总体k阶矩

μk=EXk+xkdFX(x)

总体的k阶中心矩
σk=+(xEX)kdFX(x)

μ=μ1,σ2=σ2.

注意
1)M1=X¯¯¯,S2n没叫样本方差.
2) 比较总体的期望μ、方差σ2与矩μk:
   1. 样本的均值、方差及k阶矩等都是rv,并且因n有限而总是存在的.
   2. 总体的期望、方差及k阶矩等不一定存在.且即便存在,也是实数值, 而非rv.
3)代入观察值, 有相应的样本矩的观察值x,m以及s2 等.

性质 如果总体k阶矩存在,则样本的k阶矩的数学期望等于总体的k阶矩,而当n趋于无穷时,样本的k阶矩以概率收敛到总体的k阶矩,即

这里写图片描述


顺序统计量与经验df

仍从观察值出发设法求总体分布. 以五支荧光灯寿命数据725,520,683,992,742为例,构造

这里写图片描述

df 函数(如后图)称为经验df函数.

{xi}观察值重新依序排列为{x(n)}:    x(1)x(2)xn

这里写图片描述

称为由{xi}决定的经验df, 简记为Fn(x).
将以从小到大为序重新排列的一个样本,称为顺序统计量,专记为x(1) x(2)  xn
下面一个非常重要的定理确立经验df 的重要地位. 此定理保证,几乎由每一组观察值得到的经验df,只要n足够大,都可作为总体df的近似. 定理中一致收敛性和几乎处处收敛性,给了我们充分的自由.从而由样本去找总体df,理论上有一个完满的解决.
limnFn(x)=F(x)


抽样分布与统计量

正态总体常用的样本函数

1.设总体SN(μ,σ2). 则
样本均值X¯¯¯N(μ,σ2n),从而

Z:=X¯¯¯μσ/nN(0,1)

2.K2n:=n1(Xiμσ)2的分布χ2(n)
K2nn个独立的标准正态变量的平方和,称n个独立的标准正态变量的平方和的分布为自由度为nχ2分布.
3.(n1)S2σ2χ2(n1)
样本均值与样本方差独立, 且
K2=(n1)S2σ2=1n(XiX¯¯¯σ)2  χ2(n1)

K2n=n1(Xiμσ)2中用X¯¯¯μK2.
4.T:=X¯μS/n t(n1)
Z:=X¯μσ/nN(0,1)中如σ未知,S2σ2的无偏估计,自然用S代替Z中的σ引入T
如果Z Yχ2(n)且独立,则称
t=ZY/Nt(n)

即自由度nt分布.
5.Fnm:=S21σ22S22σ21F(n1,m1)
如果Xχ2(n),Yχ2(n),且两者相互独立,则称F=χ2(n)/nχ2(m)/m(n,m)
为自由度为n,m的F分布

性质

• t 分布是对称的,且n极限为正态(n30时近似的效果就很好) .
• t 分布只有k<n阶矩.
κ2分布和F分布不对称,且x<0 时为0.
κ2 分布的可加性:设U 与V 独立,且分别~κ2(n)κ2(m),则UVκ2(n+m).
对给定的实数α(0,0.5), 使

P(X>y)=yfX(x)=α

成立的点y, 称为X 或其分布的上百分位α点. 特别对N(0,1)t(n)κ2(n)F(n,m)分布, 分别记为
zα,tα(n),χ2α(n),Fα(n,m)

使
P(X>y)=yfX(x)=1α

成立的点y, 称为X 或其分布的下百分位α点. 特别对N(0,1)t(n)κ2(n)F(n,m)分布, 分别记为
z1α,t1α(n),χ21α(n),F1α(n,m)

百分位点的值,可由表查得.

例题:

例题1:

X1,X2,,Xn, 是来自总体XN(0,σ2)的简单随机样本,求统计量

10i=1(1)iXi20i=11X2i

的分布。
解:
由题意可知XkN(0,σ2)可得
10i=1(1)iXiN(0,10σ2)
10i=1(1)iXi /10σN(0,1)
又因为20i=11(X2iσ)χ2(10)
故由t分布定义可得
10i=1(1)iXi20i=11X2i = 10i=1(1)iXi10σ(20i=11(X2i/10)σ)1t(10)

例题2:

X1,X2,,Xn+1是正态总体的简单样本,前面容量为n的样本均值和样本二阶中心矩分别为X¯¯¯S2n
试求下列样本函数的分布
1)(n1)(X1μ)2 / ni=2(Xiμ)2
2)Xn+1X¯Snn1n+1

解:
1)
(n1)(X1μ)2 / ni=2(Xiμ)2=(Xiμ)2σ2ni=2(Xiμσ)2n1
分子服从χ2(1),分母服从χ2(n1)
所以整个式子服从F(1,n1)
2)
Xn+1X¯Snn1n+1
分母部分变成:
S2n(n1)σ2χ2(n1)
分子部分变成:
Xn+1X¯σ(0,1)
因此原式变成:
Xn+1X¯σS2n(n1)σ2 / n1
服从t(n1)

0 0
原创粉丝点击