泊松分布

来源:互联网 发布:盛世乐居 知乎 编辑:程序博客网 时间:2024/04/29 08:20

泊松分布的概念

若随机变量X的可能取值为0、1、2、...,且概率分布为

则称X服从泊松分布,记为X~P(t),其中t>0且为一常数。

泊松分布多出现在当X表示在一定时间或者空间内罕见事件出现个数的场合。它是二项分布样本空间趋于无限,事件A发生概率p较小时的推导。

泊松分布的推导

假设某一时间段内,某交通路口发生事故的概率是p,为求该时间段内交通路口发生的事故个数。假设所观察的时间为[0,1),一个很大的自然数n将该区间等分为n段:l1=[0, 1/n), l2=[1/n,2/n),...,ln=[(n-1)/n,1),现做如下两个假定:

1.在每段li内,恰发生一个事故的概率近似与该段时间的长度成正比,即可取为t/n;

2.假定n很大,因为1/n很小时,在li这么短的时间内,要发生两次或者更多次的事故是不可能的,因此,在li时间段内不发生事故的概率是1-t/n;

3.各段是否发生事故的独立的。

则在时间段[0,1)内发生的事故个数X视为n个小段内有事故的时段数。按照以上假定,X服从B(n, t/n),于是P(X = i) = C(n,i)(t/n)i(1-t/n)n-i。当n->无穷„时,C(n,i)/ni-> 1/i!,(1-t/n)n -> e-t。从而得到泊松分布的等式。

由此可知泊松分布是未作二项分布的极限而得到,若X~B(n,p),其中n很大,p很小,np=t不太大时,则X的分布接近于泊松分布P(t)。由此可以将较难计算的二项分布转化为泊松分布计算。

泊松分布的性质

1.泊松分布是一种单参数分布,参数l表示单位时间或者空间内某事件平均发生的次数,又称为强度参数;

2.泊松分布的方差与均值相等,均为t;

3. 泊松分布的观察结果有可加性。若从总体均数为l1的泊松分布总体中随机抽出一份样本,其中稀有事件的发生次数为X1,再独立地从总体均数为l2的泊松分布总体中随机抽出另一份样本,其中稀有事件的发生次数为X2,则它们的合计发生数T(X1+X2)也服从泊松分布,总体均数为l1+l2。具体来讲为, 如果N1,N2,...,Nn分别为参数t1,t2,...,tn的独立泊松分布, 那么随机变量N=N1+N2+...+Nn为参数等于t1+t2+...+tn的泊松分布。

泊松分布的形态

泊松分布的形状取决于l的大小。l值越小,分布越偏,随着l的增大,分布越趋于对称,当l=20时,分布接近正态分布,当l=50时,可以认为泊松分布呈正态分布N(l, l),按正态分布处理。

 

Reference

1.陈希孺, 《概率论与数理统计》

2.山东大学,《卫生统计学》

原创粉丝点击