漫步数理统计二十七——t与F分布

来源:互联网 发布:xp系统怎么连接网络 编辑:程序博客网 时间:2024/06/04 13:01

本篇博文定义两个非常重要的分布,它们在一些统计推断问题中非常有用,也就是t分布与F分布。

W表示满足N(0,1)分布的随机变量;V表示满足χ2(r)分布的随机变量;且W,V独立,那么W,V的联合pdf,表示为h(w,v),就是W的pdf与V的pdf乘积,或者

h(w,v)={12πew2/21Γ(r/2)2r/2vr/21ev/20<w<,0<v<elsewhere

定义新的随机变量T

T=WV/r

利用变量替换方法可以得到T的pdfg1(t)。方程

t=wv/ru=v

定义了一个变换,将={(w,v):<w<,0<v<}一一映射到={(t,u):<t<,0<u<},因为w=tu/r,v=u,所以变换的雅可比绝对值为||=u/r,所以T,U=V的联合pdf为

g(t,u)=h(tur,u)||={12πΓ(r/2)2r/2ur/21exp[u2(1+t2r)]ur0|t|<,0<u<elsewhere

T的边缘pdf为

g1(t)=g(t,u)du=012πrΓ(r/2)2r/2u(r+1)/21exp[u2(1+t2r)]du

z=u[1+(t2/r)]/2得到

g1(t)=012πrΓ(r/2)2r/2(2z1+t2/r)(r+1)/21ez(21+t2/r)dz=Γ[(r+1)/2]πrΓ(r/2)1(1+t2/r)(r+1)/2,<t<(1)

所以如果W满足N(0,1)V满足χ2(r)W,V独立,那么

T=WV/r(2)

就有如上所述的pdfg1(t)。随机变量T的分布通常称为t分布,通过观察可以发现t分布完全由参数r决定,也就是卡方分布的自由度。

1T满足自由度为rt分布,那么根据(2),我们可以写成T=W(/r)1/2,其中W满足N(0,1)分布,V满足χ2(r)分布,W,V是独立的随机变量。假设(r/2)(k/2)>0,那么

E(Tk)=E[Wk(Vr)k/2]=E(Wk)E[(Vr)k/2]=E(Wk)2k/2Γ(r2k2)Γ(r2)rk/2, k<r(3)

为了求T的均值,令k=1。因为E(W)=0,所以只要T的自由度超过1,T的均值就为0。为了求方差,令k=2,这时候需要r>2,因为E(W2)=1,所以T的方差为

var(T)=E(T2)=rr2(4)

因此自由度r>2t分布均值为0,方差为r/(r2)

接下来考虑两个独立且自由度分别为r1,r2的卡方随机变量U,VU,V的联合pdfh(u,v)

h(u,v)={1Γ(r1/2)Γ(r2/2)2r1+r2/2ur1/21vr2/21e(u+v)/200<u,v<elsewhere

我们定义新的随机变量为

W=U/r1V/r2

接下里求W的pdfg1(w),方程

w=u/r1v/r2,z=v,

定义了一对一变换,将集合={(u,v):0<u<,0<v<}映射到集合={(w,z):0<w<,0<z<},因为u=(r1/r2)zw,v=z,变换的雅可比绝对值为||=(r1/r2)z,随机变量W,Z=V的联合pdfg(w,z)

g(w,z)=1Γ(r1/2)Γ(r2/2)2(r1+r2)/2(r1zwr2)r122zr222exp[z2(r1wr2+1)]r1zr2

假设(w,z),其他地方为零。W的边缘pdfg1(w)

g1(w)=g(w,z)dz=0(r1/r2)r1/2(w)r1/21Γ(r1/2)Γ(r2/2)2(r1+r2)/2z(r1+r2)/21exp[z2(r1wr2+1)]dz

变量代换

y=z2(r1wr2+1)

可得

g1(w)=0(r1/r2)r1/2(w)r1/21Γ(r1/2)Γ(r2/2)2(r1+r2)/2(2yr1w/r2+1)(r1+r2)/21ey×(2r1w/r2+1)dy={Γ[(r1+r2)/2](r1/r2)r1/2Γ(r1/2)Γ(r2/2)(w)r1/21(1+r1w/r2)(r1+r2)/200<w<elsewhere

故,如果U,V是自由度分别为r1,r2的且独立的卡方变量,那么

W=U/r1V/r2

的pdf如上所示,该随机变量的分布通常称为F分布,可以看出F分布完全由参数r1,r2决定。

2F为自由服r1,r2F分布,那么F=(r2/r1)(U/V),其中U,V是独立的χ2随机变量,自由度分别为r1,r2。因此Fk阶矩为

E(Fk)=(r2r1)kE(Uk)E(Vk)

当然假设右边的期望均存在。根据前面的定理可知k>(r1/2)恒为真,所以第一个期望恒存在,如果r2>2k那么第二个期望存在。假设为真,那么F的均值为

E(F)=r2r1r121Γ(r221)Γ(r22)=r2r22

如果r2非常大,那么E(F)约为1。

最后介绍一个定理,它是由上面的t分布推导出来的。

1X1,,Xn是独立同分布的随机变量,且每个都是均值为μ,方差为σ2的正态分布,定义新的随机变量为

X¯=1ni=1nXi,S2=1n1i=1n(XiX¯)2

那么

  1. X¯N(μ,σ2n)分布;
  2. X¯,S2是独立的;
  3. (n1)S2/σ2满足χ2(n1)分布;
  4. 随机变量
    T=X¯μS/n

    满足自由度为n1t分布。

X=(X1,,Xn),因为X1,,Xn是独立同分布的N(μ,σ2)随机变量,所以X是多元正态分布N(μ1,σ2I),其中1表示元素均为1的向量。令v=(1/n,,1/n)=(1/n)1。注意X¯=vX,定义随机向量YY=(X1X¯,,XnX¯),考虑下面的变换:

W=[X¯Y]=[vI1v]X

因为W是多元正态随机向量的线性变换,它的均值与方差为

E[W]=[vI1v]μ1=[μ0n]

其中0n表示元素全为0的向量,协方差矩阵为

Σ=[vI1v]σ2I[vI1v]=σ21n0n0nI1v

因为X¯W的第一个元素,根据前面的定理可得结论1。接下来因为协方差为0,所以X¯Y独立,但是S2=(n1)1YY,因此Y¯也与S2独立,结论2的证。

考虑随机变量

V=i=1n(Xiμσ)2

这个和的每项都是N(0,1)随机变换的平方,因此是χ2(1)分布。因为它们互相独立,所以Vχ2(n)随机变量。注意,

V=i=1n((XiX¯)+(X¯μ)σ)2=i=1n(XiX¯σ)2+(X¯muσ/n)2=(n1)S2σ2+(X¯μσ/n)2

右边两项是独立的,且第二项为标准正态分布的平方即χ2(1)分布。取两边的mgf可得

(12t)n/2=E[exp{t(n1)S2/σ2}](12t)1/2

求出的(n1)S2σ2就得到结论3。最后,利用前面三个结论即可得到结论4,

T=(X¯μ)/(σ/n)(n1)S2/(σ2(n1))

0 0
原创粉丝点击