读者可能会有这样的感受,如果样本空间C中的元素不是数的话,描述起来非常麻烦,现在我们就形式化一个规则或者一组规则,根据这些规则,C中的元素c可以用数来表示。首先讨论最简单的情况,考虑掷硬币的随机试验,样本空间是C={c:其中c是T或者c是H},T,H分别表示尾与头。X是一个函数,如果c是T,那么X(c)=0,如果c是H,那么X(c)=1,因此X是定义在样本空间C上的实值函数,这就让我们从样本空间C变换到了实数D={0,1}空间,现在我们形式化随机变量与其空间的定义。
定义1:考虑样本空间为C的随机试验,函数X给每个元素c∈C只分配一个数X(c)=x,我们称其为随机变量,X的空间或者值域是实数D={x:x=X(c),c∈C}的集合。
在我们的讨论中,D一般是可数集合或者一个实数区间,我们称第一种类型的随机变量为离散随机变量,第二种称为连续随机变量。本篇先讨论离散与连续随机变量的例子,然后再分别详细讨论他们。
随机变量X诱导出实数轴R上的新样本空间D,那么与事件B和概率P相似的又是什么呢?
考虑X是一个离散随机变量,且有一个有限的空间D={d1,…,dm},这时候有m个事件由:
{c∈C:X(c)=di},i=1,…,m
给定,因此,对于随机变量,D上的σ域是由简单事件d1,…,dm(D的集(所有子集集合)生成的,令F表示这个σ 域。
从而我们有了一个样本空间与一个事件集,那么概率集合函数呢?对于F中的任何事件B,我们定义
PX(B)=P[{c∈C:X(c)∈B}](1)
我们需要说明PX满足概率的三公理。
注意,首先PX(B)>0,其次,因为X的定义域是C,所以我们有PX(D)=P(C)=1,因此PX满足概率的前两个公理,对第三个公理得证明留给读者。由此可知PX是D上的概率,我们称PX是随机变量X 在D上导出的概率。
我们现在简化上面的讨论,因为F中的任何事件B是D={d1,…,dm}的一个子集,PX 满足
PX(B)=∑di∈BP[{c∈C:X(c)=di}]
因此,PX完全由函数
pX(di)=PX[{di}],fori=1,…,m(2)
函数pX(di)称为X的概率质量函数,简写为pmf,下面先给出一段批注,然后考虑一个实例。
注1:在等式1与2中,根据PX,pX中的下标X 可以看出他们是随机变量导出的概率集合函数与pmf,我们会经常使用这种符号,尤其是讨论多个变量的时候。另一方面,如果随机变量很明显,那么我们就省略不写。
例1:现在掷两次骰子,令X表示两次得到的数字之和,样本空间是C={(i,j):1≤i,j≤6},因为骰子每面朝上的概率是相等的,所以P[(i,j)]=1/36,随机变量X是X(i,j)=i+j,X的空间是D=2,…,12,X的pmf为
C上的概率空间的σ域由236个子集组成,(C中元素子集的个数)但是我们感兴趣的是随机变量X,只有11个我们感兴趣的事件;即事件X=k,k=2,…,12。为了说明关于X的概率计算,假设B1={x:x=7,11},B2={x:x=2,3,12},那么
PX(B1)PX(B2)=∑x∈B1pX(x)=636+236=836=∑x∈B2pX(x)=136+236+136=436
其中pX(x)如表中所示。
对于连续随机变量,考虑下面简单的试验:在区间(0,1)上随机选择一个实数,令X表示选择的数,此时X的空间是D=(0,1),这不像上面的例子那样可以容易的导出PX的概率,但是有一些直观上的概率,例如,因为数是随机选择的,所以我们感觉
PX[(a,b)]=b−a,for0<a<b<1
,我们想要
X的概率模型是由区间概率确定的,因此我们取
R上事件的类别为博莱尔
σ域
B0,它是由区间导出的。注意它也包含了离散随机变量。例如,事件
di可以用取得的交来表示;例如
{di}=∩n(di−(1/n),di]。
定义2:令X是随机变量,那么它的累加分布函数,(cdf)定义为
FX(x)=PX((−∞,x])=P(X≤x)(3)
注2:回顾一下,P是样本空间C上的概率,所以等式3中右边的项需要定义,我们定义为
P(X≤x)=P({c∈C:X(c)≤x})
这是比较方便的缩写形式,我们会经常使用这种写法。
另外,FX(x)经常称为分布函数(df),然而,我们加上累加,以此来说明FX(x)累加了小于等于x的概率。