漫步数理统计七——随机变量(上)

来源:互联网 发布:lol英雄详细数据 编辑:程序博客网 时间:2024/04/25 11:56

读者可能会有这样的感受,如果样本空间C中的元素不是数的话,描述起来非常麻烦,现在我们就形式化一个规则或者一组规则,根据这些规则,C中的元素c可以用数来表示。首先讨论最简单的情况,考虑掷硬币的随机试验,样本空间是C={c:cTcH}T,H分别表示尾与头。X是一个函数,如果cT,那么X(c)=0,如果cH,那么X(c)=1,因此X是定义在样本空间C上的实值函数,这就让我们从样本空间C变换到了实数D={0,1}空间,现在我们形式化随机变量与其空间的定义。

1考虑样本空间为C的随机试验,函数X给每个元素cC只分配一个数X(c)=x,我们称其为随机变量,X的空间或者值域是实数D={x:x=X(c),cC}的集合。

在我们的讨论中,D一般是可数集合或者一个实数区间,我们称第一种类型的随机变量为离散随机变量,第二种称为连续随机变量。本篇先讨论离散与连续随机变量的例子,然后再分别详细讨论他们。

随机变量X诱导出实数轴R上的新样本空间D,那么与事件B和概率P相似的又是什么呢?

考虑X是一个离散随机变量,且有一个有限的空间D={d1,,dm},这时候有m个事件由:

{cC:X(c)=di},i=1,,m

给定,因此,对于随机变量,D上的σ域是由简单事件d1,,dm(D的集(所有子集集合)生成的,令F表示这个σ 域。

从而我们有了一个样本空间与一个事件集,那么概率集合函数呢?对于F中的任何事件B,我们定义

PX(B)=P[{cC:X(c)B}](1)

我们需要说明PX满足概率的三公理。

注意,首先PX(B)>0,其次,因为X的定义域是C,所以我们有PX(D)=P(C)=1,因此PX满足概率的前两个公理,对第三个公理得证明留给读者。由此可知PXD上的概率,我们称PX是随机变量XD上导出的概率。

我们现在简化上面的讨论,因为F中的任何事件BD={d1,,dm}的一个子集,PX 满足

PX(B)=diBP[{cC:X(c)=di}]

因此,PX完全由函数

pX(di)=PX[{di}],fori=1,,m(2)

函数pX(di)称为X的概率质量函数,简写为pmf,下面先给出一段批注,然后考虑一个实例。

1在等式1与2中,根据PX,pX中的下标X 可以看出他们是随机变量导出的概率集合函数与pmf,我们会经常使用这种符号,尤其是讨论多个变量的时候。另一方面,如果随机变量很明显,那么我们就省略不写。

1现在掷两次骰子,令X表示两次得到的数字之和,样本空间是C={(i,j):1i,j6},因为骰子每面朝上的概率是相等的,所以P[(i,j)]=1/36,随机变量XX(i,j)=i+jX的空间是D=2,,12X的pmf为


这里写图片描述

C上的概率空间的σ域由236个子集组成,(C中元素子集的个数)但是我们感兴趣的是随机变量X,只有11个我们感兴趣的事件;即事件X=k,k=2,,12。为了说明关于X的概率计算,假设B1={x:x=7,11},B2={x:x=2,3,12},那么

PX(B1)PX(B2)=xB1pX(x)=636+236=836=xB2pX(x)=136+236+136=436

其中pX(x)如表中所示。

对于连续随机变量,考虑下面简单的试验:在区间(0,1)上随机选择一个实数,令X表示选择的数,此时X的空间是D=(0,1),这不像上面的例子那样可以容易的导出PX的概率,但是有一些直观上的概率,例如,因为数是随机选择的,所以我们感觉

PX[(a,b)]=ba,for0<a<b<1
,我们想要X的概率模型是由区间概率确定的,因此我们取R上事件的类别为博莱尔σB0,它是由区间导出的。注意它也包含了离散随机变量。例如,事件di可以用取得的交来表示;例如{di}=n(di(1/n),di]

2X是随机变量,那么它的累加分布函数,(cdf)定义为

FX(x)=PX((,x])=P(Xx)(3)

2回顾一下,P是样本空间C上的概率,所以等式3中右边的项需要定义,我们定义为

P(Xx)=P({cC:X(c)x})

这是比较方便的缩写形式,我们会经常使用这种写法。

另外,FX(x)经常称为分布函数(df),然而,我们加上累加,以此来说明FX(x)累加了小于等于x的概率。

0 0
原创粉丝点击