指数分布和泊松过程（二）

来源：互联网发布：网络域名申请编辑：程序博客网时间：2024/05/17 12:53

计数过程
一个随机过程称为是计数过程，如果N(t)表示时间t为止发生事件的个数。
如果发生在不相交的时间段中的事件个数是相互独立对的，那么我们称这个过程独立增量过程。
如果发生在不相交的时间段中的事件个数的分布只依赖与时间差，不依赖与时间起点和终点，那么我们称这个过程是平稳增量过程

泊松过程
定义 1如果一个计数过程N(t)满足如下三个条件，那么我们称这个过程是泊松过程
(1)N(0)=0;
(2)N(t)是独立增量过程
(3)在一个时间长度为t的时间段中事件发生的次数服从参数为λt的泊松过程。有

P (N (s + t) - N (t) = k) = ( λ t ) k k ! e - λ t

Remark：这个定义并不能用作我们实际的判断一个过程是否是泊松过程。原因是我们并不能判断条件三的成立。
因此我们给出如下的一个等价定义
定义 2一个计数过程N(t)被称作泊松过程，如果它满足如下的条件
(1)N(0)=0;
(2)N(t)是独立增量过程;
(3)P(N(t+h)−N(t)=1)=λh+o(h);
(4)P((N(t+h)−N(t))≥2)=o(h);
对于定义2的理解，如果在一个很短的时间内时间发生多次(≥2)的概率趋于零，同时如果在很短的时间内时间发生一次的概率也是逐渐递减的，在判断一个过程是不是泊松过程时，就看一下是否是独立增量的，同时看一下在任意小的时间段内，事件发生的概率是否非常小，如果是这样，那么这个过程就很有可能是泊松过程。

泊松过程的性质

性质一.到达时间间隔
考虑一个泊松过程，从开始到第一个事件发生所经历的时间为T1，从第n-1个事件发生到第n个时间发生的时间我们记为Tn
,那么Tn的分布是参数为λ指数分布，同时{Tn}是相互独立的。
分析：首先我们证明T1和T2有相同的分布。这个不能直接从泊松过程的平稳增量性来得到，原因是平稳增量性是说在在某个时间断种事件发生的次数只和时间段的长度有关。但是我们现在想要说明的是从开始到第一次事件的发生所经历的时间与从第一次事件结束到第二次事件发生的时间服从的分布是相同的。不过这可以通过一个转换来得到

P (T 1 > t) = P (N (t) = 0) (1)

P (T 2 > t) = E (P (T 2 > t | T 1)) （ 全 概 率 公 式 ）

P (T 2 > t | T 1 = s) = P (N (t + s) - N (s) = 0) (2)

可以看出式（1）和式（2）是相同的。所以

T1和

T2有相同的分布

同时,我们知道

T1之后事件发生与

T1之前发生是相互独立的。

结合以上两点，我们可以得到

T1之后事件的发生和

T1之前事件的发生是没有关系的，同时事件的发生所经历的时间服从相同的分布。这显然就是指数分布。这里的事件的发生是指条件的第一次事件的发生，比如从

T1时刻起，第一次时间的发生，其实就是整个泊松过程第二次事件的发生。

性质二等待时间的分布
第n个事件发生所经过的时间为Sn，表示知道第n个时间的等待时间。显然有

S n = \sum k = 1 n T k

,这个是伽马分布，参数为

(n,λ).

性质三泊松过程的分解和合并
(分解)假设N(t)是参数为λ一个泊松过程，它表示某个事件的计数过程。如果这个时间还可以分成多类的子事件，我们以两个子事件为例，每个事件发生的概率为p和1-p，并记N1(t)和N2(t)，表示这两个子事件发生的次数。我们自然有

N (t) = N 1 (t) + N 2 (t)

，

N1(t)和

N2(t)也是泊松过程，参数是

λp和

λ(1−p).并且它们是独立的。

(合并)假设有两个参数为

λ1和

λ2泊松过程，它们是相互独立的，那么它们的和也是一个泊松过程，同时参数是

λ1+λ2.

例1（性质三的应用）假设一个软件包有m个故障，m是未知的，故障i按照一个未知的速率λi的泊松过程引起错误的发生。同时故障引起错误的发生之间是相互独立的。现在将这个软件包运行t个时间，并记录所犯错误的个数。同时对这个错误引起的故障进行修复。问题是修复了这个软件包之后，它的错误率（单位时间引起的错误数）。

分析：其实就是说，在经过了t个时间之后，还有一些故障没有被修复，原因就是在t个时间内，这些故障没有引起相应的错误。（这个问题需要有个假设，就是发生了错误之后，我们知道这个错误是有哪些故障引起的）。我们用
ψi(t)=1表示到t时间时，第i个故障没有引起错误。那么我们要求的就是

Λ (t) = \sum i λ i ψ (t) (3)

对这个式子的解释就是在t时间后，我们修复了一部分故障，但是还有一些故障，这些故障在时间t分别引起的错误数是一个泊松过程，那么总错误数也是一个泊松过程。它的参数就表示单位时间引发的错误数，也就是错误率。
我们有

E (Λ (t)) = \sum i λ i E (ψ i (t)) = \sum i λ i e - λ i t

但是我们并不知道到底是那些故障没有引发错误，所以我们是没有办法求解式（3）,可是我们知道那些故障引起了错误。因此我们用

Mj(t)表示在前t个时间内，引发一个错误的故障数。同时定义示性函数

Ii(t)=1表示第i个故障恰好引发一个故障,反之为0.那么我们知道

M 1 (t) = \sum i I i (t)

E (M 1 (t)) = \sum i λ i t e - λ i t (4)

根据公式（3）和公式（4），我们可以用

M1(t)t来估计

Λ(t).

但是估计误差是多少呢？计算Var(M1(t)t−Λ(t))

V a r (M 1 ( t ) t - Λ (t)) = E (M 1 (t) - Λ (t)) = E ( M 1 ( t ) + 2 M 2 ( t ) ) t 2

这样我们可以通过观察发生2个错误的故障的个数和发生1个错误的故障的个数来估计误差。

1 0