随机变量及概率分布

来源:互联网 发布:安装linux的步骤 编辑:程序博客网 时间:2024/05/02 00:02

本文主要包含四个部分的内容:一维随机变量及其概率分布、二维随机变量及其概率分布、条件分布、随机变量的相互独立性。

1. 一维随机变量

1.1 随机变量与分布函数

- 分布函数
设X是一个随机变量,记

F(x)=P{X<x},x(,+)

F(x)为随机变量 X 的分布函数。

- 性质(充要条件)

  • F(x) 非降
  • F(x) 取值在0-1之间
  • F(x) 右连续

1.2 离散型随机变量

- 分布律/概率函数:
设X为离散型随机哦变量,其所有可能的取值为x1,x2,...,则

pi=P{X=xi}

称为随机变量X的分布律/概率函数。

- 分布函数

F(x)=P{Xx}=xixP{X=xi}=xixpi

- 单点分布
分布律为 P{x=a}=1,称X服从单点分布,记 X(a1)

- 两点分布
分布律为 P(X=a0)=1pP(X=a1)=p,或统一表示为 P{X=ai}=pi(1p)1i(i=0,1),其中 0<p<1

0-1分布(伯努利分布)
a0=0,a1=1时的两点分布,记 XB(1,p)

- 二项分布
分布律为 P{X=i}=(ni)pi(1p)ni,i=0,1,2,...,n,其中 0<p<1 ,则称X服从参数为 n,p 的二项分布,记 XB(n,p)

- 泊松分布
分布律 P{X=k}=λkeλk!,k=0,1,2,...,其中 λ>0 为常数,则称X服从参数为 λ 的泊松分布。泊松分布是二项分布的极限分布

- 泊松定理
随机变量X服从二项分布 B(n,pn)(n=1,2,...),其中 pn 与 n 有关且满足 limnnpn=λ>0,则

limn(nk)pkn(1pn)nk=λkk!eλ

当n很大(指n10)且p较小(指p0.1)时,可以用泊松定理近似计算二项分布的概率

1.3 连续型随机变量

- 概率密度
随机变量 X 的分布函数为 F(x),若存在非负可积函数 f(x),使对于任意实数 x,有

F(x)=xf(t)dt

则称 X 为连续型随机变量,并称 f(x)X 的概率密度。

- 性质

  • f(x) 非负
  • +f(x)d(x)=1
  • P{a<xb}=F(b)F(a)=baf(x)dx,其中 ab
  • f(x)x 点处连续,则有 F(x)=f(x)
  • 连续型随机变量的分布函数 F(x) 必为连续函数
  • 连续型随机变量取任意实数的概率等于零P{X=x}=0

- 正态分布
连续型随机变量 X 的概率密度为

f(x)=12πσe(xμ)22σ2(<x<+)

其中 μ,σ(σ>0) 位常数,则称 X 服从参数为 μ,σ 的正态分布,记 XN(μ,σ)

- 标准正态分布
μ=0,σ=1 时称 X 服从标准正态分布,其概率密度、分布函数分别用 φ(x),Φ(x) 来表示。

φ(x)=12πex22Φ(x)=x12πet22

命题XN(μ,σ2)Z=XμσN(0,1)
可利用该命题结合 Φ 函数值表,进行任何正态分布的概率计算。

- 均匀分布

- 指数分布

2. 二维随机变量

2.1 二维随机变量与联合分布函数

- 联合分布函数
(X,Y) 是二维随机变量,对任意实数 xy,二元函数

F(x,y)=P{Xx,Yy}

称为二维随机变量 (X,Y) 的联合分布函数。(直观理解就是随机点落入点(x,y)的左下方的无穷矩形内的概率)

- 性质

  • F(x,y)对每个变元是非降函数
  • F(x,y)对每个变元是右连续的
  • F(,y)=F(x,)=F(,)
  • Px1<Xx2,y2<Yy2=F(x2,y2)F(x2,y1)F(x1,y2)+F(x1,y1)

给定二维随机变量 (X,Y) 的联合概率分布函数 F(x,y),则它的两个分量 XY 的分布函数 FX(x)FY(y) 也随之确定,反之不成立:

  • FX(x)=F(x,+)
  • FY(y)=F(+,y)

FX(x),FY(y) 称为关于X、Y的边缘分布函数

2.2 二维离散型随机变量

若二维随机变量 (X,Y) 的所有可能取的值是有限对或无穷可列对 (xi,yi)(i,j=1,2,...),则称 (X,Y) 是二维随机变量。

联合分布律为: P{X=xi,Y=yi}=pij(i,j=1,2,...)

联合分布函数为: F(x,y)=xixyiypij

边缘分布率为: pi=P{X=xi}=j=1pij,pj=P{Y=yj}=i=1pij(i,j=1,2,...)

2.3 二维连续型随机变量

F(x,y) 为二维随机变量 (X,Y) 的联合分布函数,若存在一个非负函数 f(x,y)(<x<+,<y<+),使对任意实数 x,y 都有

F(x,y)=yxf(u,v)dudv

则称 (X,Y) 为二维连续型随机变量,并称 f(x,y)(X,Y)联合概率密度,简称概率密度。

- 性质

  • f(x,y)0
  • ++f(u,v)dudv=1
  • f(x,y) 在点 (x,y) 处连续,则 2F(x,y)xy=f(x,y)
  • P{(X,Y)落在区域G中的} = Gf(x,y)dxdy

- 边缘概率密度

fX(x)=+f(x,y)dyfY(y)=+f(x,y)dx

- 二维正态分布

- 二维均匀分布

3. 条件分布

(X,Y) 是二维离散型随机变量,其联合分布律以及 (X,Y) 关于 XY 的边缘分布律分别由以下几个式子给出:

联合分布律:

P{X=xi,Y=yj}=pij(i,j=1,2,...)

边缘分布率:
P{X=xi}=pi=j=1pij(i=1,2,...)P{Y=yj}=pj=i=1pij(j=1,2,...)

对于固定的 j,若 P{Y=yj}>0,则称

P{X=xi|Y=yj}=pijpj(i=1,2,...)

为在 Y=yj 的条件下随机变量 X条件分布率

条件分布函数/条件概率密度
设二维连续型随机变量 (X,Y) 的概率密度为 f(x,y),(X,Y) 关于 Y 的边缘概率密度为 fY(y)。若对于固定的 yfY(y)>0,则定义给定 Y=yX 的条件分布函数为

FX|Y(x|y)=P{Xx|Yy}=xfX|Y(u|y)du

其中 fX|Y(x|y)=f(x,y)/fY(y) 称为 Y=y 的条件下 X 的条件概率密度。

一个有用的等式:

f(x,y)=fX(x)fY|X(y|x)=fY(y)fX|Y(x|y)

4. 随机变量的相互独立性

(X,Y) 是二维随机变量, F(x,y)FX(x),FY(y) 分别是 (X,Y) 的联合分布函数及概率分布函数,若对于任意实数 x,y 恒有

P{Xx,Yy}=P{Xx}P{Yy}

即:
F(x,y)=FX(x)FY(y)

则称随机变量 XY相互独立的。

离散型随机变量
对于 (X,Y) 的所有可能取值 (xi,yi)(i,j=1,2,...) 都有:

P{X=xi,Y=yi}=P{X=xi}P{Y=yi}(i,j=1,2,...)

连续型随机变量
f(x,y),fX(x),fY(y)分别是 (X,Y) 的联合概率密度及边缘概率密度,则 XY 相互独立的条件等价于:

f(x,y)=fX(x)fY(y)

几乎处处成立。

0 0