泊松分布

来源：互联网发布：盛世乐居知乎编辑：程序博客网时间：2024/04/29 08:20

泊松分布的概念

若随机变量X的可能取值为0、1、2、...，且概率分布为

则称X服从泊松分布，记为X~P(t)，其中t>0且为一常数。

泊松分布多出现在当X表示在一定时间或者空间内罕见事件出现个数的场合。它是二项分布样本空间趋于无限，事件A发生概率p较小时的推导。

泊松分布的推导

假设某一时间段内，某交通路口发生事故的概率是p，为求该时间段内交通路口发生的事故个数。假设所观察的时间为[0,1)，一个很大的自然数n将该区间等分为n段：l₁=[0, 1/n), l₂=[1/n,2/n),...,l_n=[(n-1)/n,1)，现做如下两个假定：

1.在每段li内，恰发生一个事故的概率近似与该段时间的长度成正比，即可取为t/n；

2.假定n很大，因为1/n很小时，在li这么短的时间内，要发生两次或者更多次的事故是不可能的，因此，在li时间段内不发生事故的概率是1-t/n；

3.各段是否发生事故的独立的。

则在时间段[0,1)内发生的事故个数X视为n个小段内有事故的时段数。按照以上假定，X服从B(n, t/n)，于是P(X = i) = C(n,i)(t/n)ⁱ(1-t/n)^n-i。当n->无穷„时，C(n,i)/nⁱ-> 1/i!，(1-t/n)ⁿ -> e^-t。从而得到泊松分布的等式。

由此可知泊松分布是未作二项分布的极限而得到，若X~B(n,p)，其中n很大，p很小，np=t不太大时，则X的分布接近于泊松分布P(t)。由此可以将较难计算的二项分布转化为泊松分布计算。

泊松分布的性质

1.泊松分布是一种单参数分布，参数l表示单位时间或者空间内某事件平均发生的次数，又称为强度参数；

2.泊松分布的方差与均值相等，均为t；

3. 泊松分布的观察结果有可加性。若从总体均数为l1的泊松分布总体中随机抽出一份样本，其中稀有事件的发生次数为X1，再独立地从总体均数为l2的泊松分布总体中随机抽出另一份样本，其中稀有事件的发生次数为X2，则它们的合计发生数T(X1+X2)也服从泊松分布，总体均数为l1+l2。具体来讲为, 如果N1,N2,...,Nn分别为参数t1,t2,...,tn的独立泊松分布, 那么随机变量N=N1+N2+...+Nn为参数等于t1+t2+...+tn的泊松分布。

泊松分布的形态

泊松分布的形状取决于l的大小。l值越小，分布越偏，随着l的增大，分布越趋于对称，当l=20时，分布接近正态分布，当l=50时，可以认为泊松分布呈正态分布N(l, l)，按正态分布处理。

Reference

1.陈希孺, 《概率论与数理统计》

2.山东大学,《卫生统计学》