漫步数理统计二十七——t与F分布

来源：互联网发布：xp系统怎么连接网络编辑：程序博客网时间：2024/06/04 13:01

本篇博文定义两个非常重要的分布，它们在一些统计推断问题中非常有用，也就是t分布与F分布。

令W表示满足N(0,1)分布的随机变量；V表示满足χ2(r)分布的随机变量；且W,V独立，那么W,V的联合pdf，表示为h(w,v)，就是W的pdf与V的pdf乘积，或者

h (w, v) = {1 2 π \sqrt e - w 2 / 2 1 Γ ( r / 2 ) 2 r / 2 v r / 2 - 1 e - v / 2 0 \infty < w < \infty, 0 < v < \infty e l s e w h e r e

定义新的随机变量T为

T = W V / r ‾ ‾ ‾ ‾ \sqrt

利用变量替换方法可以得到T的pdfg1(t)。方程

t = w v / r ‾ ‾ ‾ \sqrt u = v

定义了一个变换，将={(w,v):−∞<w<∞,0<v<∞}一一映射到={(t,u):−∞<t<∞,0<u<∞}，因为w=tu‾‾√/r√,v=u，所以变换的雅可比绝对值为||=u‾‾√/r√，所以T,U=V的联合pdf为

g (t, u) = h (t u ‾ ‾ \sqrt r \sqrt, u) |  | = {1 2 π \sqrt Γ ( r / 2 ) 2 r / 2 u r / 2 - 1 exp [- u 2 (1 + t 2 r)] u \sqrt r \sqrt 0 | t | < \infty, 0 < u < \infty e l s e w h e r e

T的边缘pdf为

g 1 (t) = \int \infty - \infty g (t, u) d u = \int \infty 0 1 2 π r ‾ ‾ ‾ ‾ \sqrt Γ ( r / 2 ) 2 r / 2 u (r + 1) / 2 - 1 exp [- u 2 (1 + t 2 r)] d u

令z=u[1+(t2/r)]/2得到

g 1 (t) = \int \infty 0 1 2 π r ‾ ‾ ‾ ‾ \sqrt Γ ( r / 2 ) 2 r / 2 (2 z 1 + t 2 / r) (r + 1) / 2 - 1 e - z (2 1 + t 2 / r) d z = Γ [ ( r + 1 ) / 2 ] π r ‾ ‾ ‾ \sqrt Γ ( r / 2 ) 1 ( 1 + t 2 / r ) ( r + 1 ) / 2, - \infty < t < \infty (1)

所以如果W满足N(0,1)，V满足χ2(r)且W,V独立，那么

T = W V / r ‾ ‾ ‾ ‾ \sqrt (2)

就有如上所述的pdfg1(t)。随机变量T的分布通常称为t分布，通过观察可以发现t分布完全由参数r决定，也就是卡方分布的自由度。

例1：T满足自由度为r的t分布，那么根据(2)，我们可以写成T=W(/r)−1/2，其中W满足N(0,1)分布，V满足χ2(r)分布，W,V是独立的随机变量。假设(r/2)−(k/2)>0，那么

E (T k) = E [W k (V r) - k / 2] = E (W k) E [(V r) - k / 2] = E (W k) 2 - k / 2 Γ ( r 2 - k 2 ) Γ ( r 2 ) r - k / 2, k < r (3)

为了求T的均值，令k=1。因为E(W)=0，所以只要T的自由度超过1，T的均值就为0。为了求方差，令k=2，这时候需要r>2，因为E(W2)=1，所以T的方差为

v a r (T) = E (T 2) = r r - 2 (4)

因此自由度r>2的t分布均值为0，方差为r/(r−2)。

接下来考虑两个独立且自由度分别为r1,r2的卡方随机变量U,V，U,V的联合pdfh(u,v)为

h (u, v) = {1 Γ ( r 1 / 2 ) Γ ( r 2 / 2 ) 2 r 1 + r 2 / 2 u r 1 / 2 - 1 v r 2 / 2 - 1 e - (u + v) / 2 0 0 < u, v < \infty e l s e w h e r e

我们定义新的随机变量为

W = U / r 1 V / r 2

接下里求W的pdfg1(w)，方程

w = u / r 1 v / r 2, z = v,

定义了一对一变换，将集合={(u,v):0<u<∞,0<v<∞}映射到集合={(w,z):0<w<∞,0<z<∞}，因为u=(r1/r2)zw,v=z，变换的雅可比绝对值为||=(r1/r2)z，随机变量W,Z=V的联合pdfg(w,z)为

g (w, z) = 1 Γ ( r 1 / 2 ) Γ ( r 2 / 2 ) 2 ( r 1 + r 2 ) / 2 (r 1 z w r 2) r 1 - 2 2 z r 2 - 2 2 exp [- z 2 (r 1 w r 2 + 1)] r 1 z r 2

假设(w,z)∈，其他地方为零。W的边缘pdfg1(w)为

g 1 (w) = \int \infty - \infty g (w, z) d z = \int \infty 0 ( r 1 / r 2 ) r 1 / 2 ( w ) r 1 / 2 - 1 Γ ( r 1 / 2 ) Γ ( r 2 / 2 ) 2 ( r 1 + r 2 ) / 2 z (r 1 + r 2) / 2 - 1 exp [- z 2 (r 1 w r 2 + 1)] d z

变量代换

y = z 2 (r 1 w r 2 + 1)

可得

g 1 (w) = \int \infty 0 ( r 1 / r 2 ) r 1 / 2 ( w ) r 1 / 2 - 1 Γ ( r 1 / 2 ) Γ ( r 2 / 2 ) 2 ( r 1 + r 2 ) / 2 (2 y r 1 w / r 2 + 1) (r 1 + r 2) / 2 - 1 e - y \times (2 r 1 w / r 2 + 1) d y = {Γ [ ( r 1 + r 2 ) / 2 ] ( r 1 / r 2 ) r 1 / 2 Γ ( r 1 / 2 ) Γ ( r 2 / 2 ) ( w ) r 1 / 2 - 1 ( 1 + r 1 w / r 2 ) ( r 1 + r 2 ) / 2 0 0 < w < \infty e l s e w h e r e

故，如果U,V是自由度分别为r1,r2的且独立的卡方变量，那么

W = U / r 1 V / r 2

的pdf如上所示，该随机变量的分布通常称为F分布，可以看出F分布完全由参数r1,r2决定。

例2：F为自由服r1,r2的F分布，那么F=(r2/r1)(U/V)，其中U,V是独立的χ2随机变量，自由度分别为r1,r2。因此F的k阶矩为

E (F k) = (r 2 r 1) k E (U k) E (V - k)

当然假设右边的期望均存在。根据前面的定理可知k>−(r1/2)恒为真，所以第一个期望恒存在，如果r2>2k那么第二个期望存在。假设为真，那么F的均值为

E (F) = r 2 r 1 r 1 2 - 1 Γ ( r 2 2 - 1 ) Γ ( r 2 2 ) = r 2 r 2 - 2

如果r2非常大，那么E(F)约为1。

最后介绍一个定理，它是由上面的t分布推导出来的。

定理1：令X1,…,Xn是独立同分布的随机变量，且每个都是均值为μ，方差为σ2的正态分布，定义新的随机变量为

X ¯ = 1 n \sum i = 1 n X i, S 2 = 1 n - 1 \sum i = 1 n (X i - X ¯) 2

那么

证明：令X=(X1,…,Xn)′，因为X1,…,Xn是独立同分布的N(μ,σ2)随机变量，所以X是多元正态分布N(μ1,σ2I)，其中1表示元素均为1的向量。令v′=(1/n,…,1/n)′=(1/n)1′。注意X¯=v′X，定义随机向量Y为Y=(X1−X¯,…,Xn−X¯)′，考虑下面的变换：

W = [X ¯ Y] = [v' I - 1 v'] X

因为W是多元正态随机向量的线性变换，它的均值与方差为

E [W] = [v' I - 1 v'] μ 1 = [μ 0 n]

其中0n表示元素全为0的向量，协方差矩阵为

Σ = [v' I - 1 v'] σ 2 I [v' I - 1 v']' = σ 2 ⎡ ⎣ ⎢ ⎢ 1 n 0 n 0' n I - 1 v' ⎤ ⎦ ⎥ ⎥

因为X¯是W的第一个元素，根据前面的定理可得结论1。接下来因为协方差为0，所以X¯与Y独立，但是S2=(n−1)−1Y′Y，因此Y¯也与S2独立，结论2的证。

考虑随机变量

V = \sum i = 1 n (X i - μ σ) 2

这个和的每项都是N(0,1)随机变换的平方，因此是χ2(1)分布。因为它们互相独立，所以V是χ2(n)随机变量。注意，

V = \sum i = 1 n (( X i - X ¯ ) + ( X ¯ - μ ) σ) 2 = \sum i = 1 n (X i - X ¯ σ) 2 + (X ¯ - m u σ / n ‾ ‾ \sqrt) 2 = ( n - 1 ) S 2 σ 2 + (X ¯ - μ σ / n ‾ ‾ \sqrt) 2

右边两项是独立的，且第二项为标准正态分布的平方即χ2(1)分布。取两边的mgf可得

(1 - 2 t) - n / 2 = E [exp {t (n - 1) S 2 / σ 2}] (1 - 2 t) - 1 / 2

求出的(n−1)S2σ2就得到结论3。最后，利用前面三个结论即可得到结论4，

T = ( X ¯ - μ ) / ( σ / n ‾ ‾ \sqrt ) ( n - 1 ) S 2 / ( σ 2 ( n - 1 ) ) ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ ‾ \sqrt

0 0