漫步数理统计七——随机变量(上)

来源：互联网发布：lol英雄详细数据编辑：程序博客网时间：2024/04/25 11:56

读者可能会有这样的感受，如果样本空间C中的元素不是数的话，描述起来非常麻烦，现在我们就形式化一个规则或者一组规则，根据这些规则，C中的元素c可以用数来表示。首先讨论最简单的情况，考虑掷硬币的随机试验，样本空间是C={c:其中c是T或者c是H}，T,H分别表示尾与头。X是一个函数，如果c是T，那么X(c)=0，如果c是H，那么X(c)=1，因此X是定义在样本空间C上的实值函数，这就让我们从样本空间C变换到了实数D={0,1}空间，现在我们形式化随机变量与其空间的定义。

定义1：考虑样本空间为C的随机试验，函数X给每个元素c∈C只分配一个数X(c)=x，我们称其为随机变量，X的空间或者值域是实数D={x:x=X(c),c∈C}的集合。

在我们的讨论中，D一般是可数集合或者一个实数区间，我们称第一种类型的随机变量为离散随机变量，第二种称为连续随机变量。本篇先讨论离散与连续随机变量的例子，然后再分别详细讨论他们。

随机变量X诱导出实数轴R上的新样本空间D，那么与事件B和概率P相似的又是什么呢？

考虑X是一个离散随机变量，且有一个有限的空间D={d1,…,dm}，这时候有m个事件由：

{c \in C : X (c) = d i}, i = 1, \dots, m

给定，因此，对于随机变量，D上的σ域是由简单事件d1,…,dm(D的集(所有子集集合)生成的，令F表示这个σ 域。

从而我们有了一个样本空间与一个事件集，那么概率集合函数呢？对于F中的任何事件B，我们定义

P X (B) = P [{c \in C : X (c) \in B}] (1)

我们需要说明PX满足概率的三公理。

注意，首先PX(B)>0，其次，因为X的定义域是C，所以我们有PX(D)=P(C)=1，因此PX满足概率的前两个公理，对第三个公理得证明留给读者。由此可知PX是D上的概率，我们称PX是随机变量X 在D上导出的概率。

我们现在简化上面的讨论，因为F中的任何事件B是D={d1,…,dm}的一个子集，PX 满足

P X (B) = \sum d i \in B P [{c \in C : X (c) = d i}]

因此，PX完全由函数

p X (d i) = P X [{d i}], f o r i = 1, \dots, m (2)

函数pX(di)称为X的概率质量函数，简写为pmf，下面先给出一段批注，然后考虑一个实例。

注1：在等式1与2中，根据PX,pX中的下标X 可以看出他们是随机变量导出的概率集合函数与pmf，我们会经常使用这种符号，尤其是讨论多个变量的时候。另一方面，如果随机变量很明显，那么我们就省略不写。

例1：现在掷两次骰子，令X表示两次得到的数字之和，样本空间是C={(i,j):1≤i,j≤6}，因为骰子每面朝上的概率是相等的，所以P[(i,j)]=1/36，随机变量X是X(i,j)=i+j，X的空间是D=2,…,12，X的pmf为

C上的概率空间的σ域由236个子集组成，(C中元素子集的个数)但是我们感兴趣的是随机变量X，只有11个我们感兴趣的事件；即事件X=k,k=2,…,12。为了说明关于X的概率计算，假设B1={x:x=7,11},B2={x:x=2,3,12}，那么

P X (B 1) P X (B 2) = \sum x \in B 1 p X (x) = 6 36 + 2 36 = 8 36 = \sum x \in B 2 p X (x) = 1 36 + 2 36 + 1 36 = 4 36

其中pX(x)如表中所示。

对于连续随机变量，考虑下面简单的试验：在区间(0,1)上随机选择一个实数，令X表示选择的数，此时X的空间是D=(0,1)，这不像上面的例子那样可以容易的导出PX的概率，但是有一些直观上的概率，例如，因为数是随机选择的，所以我们感觉

P X [(a, b)] = b - a, f o r 0 < a < b < 1

，我们想要

X的概率模型是由区间概率确定的，因此我们取

R上事件的类别为博莱尔

σ域

B0，它是由区间导出的。注意它也包含了离散随机变量。例如，事件

di可以用取得的交来表示；例如

{di}=∩n(di−(1/n),di]。

定义2：令X是随机变量，那么它的累加分布函数，(cdf)定义为

F X (x) = P X ((- \infty, x]) = P (X \leq x) (3)

注2：回顾一下，P是样本空间C上的概率，所以等式3中右边的项需要定义，我们定义为

P (X \leq x) = P ({c \in C : X (c) \leq x})

这是比较方便的缩写形式，我们会经常使用这种写法。

另外，FX(x)经常称为分布函数(df)，然而，我们加上累加，以此来说明FX(x)累加了小于等于x的概率。

0 0