伯努利分布、二项分布、几何分布、超几何分布、泊松分布

来源:互联网 发布:中国大数据市场份额 编辑:程序博客网 时间:2024/05/01 00:38

目录(?)[+]

导语

       对于任何一个学习概率论的童鞋来说,各种分布都是很头痛的一件事情,本篇主要讨论的是离散型随机变量.

伯努利分布

       伯努利分布就是我们常见的0-1分布,即它的随机变量只取0或者1,各自的频率分别取1pp,当x=0或者x=1时,我们数学定义为: 

p(x)=px(1p)1x

       其它情况下p(x)=0,伯努利分布是一个非常好理解的分布,也是很多其它分布的基础。

离散型随机变量期望:E(x)=xp(x) 
方差:D(x)=E(x2)E2(x)

       对于伯努利分布来说,E(x)=1p+0(1p)=p,D(x)=12pp2=p(1p)

二项分布

       二项分布是这样一种分布,假设进行n次独立实验,每次实验“成功”的概率为p,失败的概率为1p,所有成功的次数X就是一个参数为np的二项随机变量.数学公式定义为: 

p(k)=(nk)pk(1p)nk

       二项分布公式基于伯努利分布得到,因为二项分布中每项实验都是独立的,因此每一次实验都是一次伯努利实验,在n次实验中,成功k次,排列方式有(nk)种,根据乘法原理,即可得到二项分布的公式。

话外:对于均值和方差的计算,Xi是标准的伯努利分布,总发生次数X=n1Xi,所以E(X)=E(n1Xi)=n1E(Xi)=np,同理方差D(x)=n1D(Xi)=np(1p)

几何分布和负二项分布

       这是一个比较简单的分布,其中负二项分布是几何分布的一般形式,几何分布与二项分布类似,也是由n次伯努利分布构成,随机变量X表示第一次成功所进行试验的次数,则 

p(k)=P(X=k)=p(1p)k1,k=1,2,3,...

       负二项分布是几何分布的一般形式,表示直到成功r次停止,显而易见,当r=1时,它就是几何分布,则 
P(X=k)=(k1r1)pr(1p)kr

关于几何分布的期望与方差,E(X)=1/pD(x)=(1p)/p2,关于期望的证明,E(X)=n=1npqn1=pn=1(qn)=p(n=1qn)=1/p,方差证明与期望证明类似,不再赘述…

超几何分布

       非常常见的一种分布,常用来表示在N个物品中有指定商品M个,不放回抽取n个,抽中指定商品的个数,即X~H(N,n,M),则抽中k件的概率为: 

p(k)=P(X=k)=(Mk)(NMnk)(Nn)

       实际应用中超几何分布例子很多,比如彩票开奖你所符合的数字个数等。

泊松分布

       泊松分布是离散型随机变量分布中相对较难的一种,泊松频率函数定义为: 

P(X=k)=λkeλk!k=0,1,2,3,...

       泊松分布是二项分布的极限形式,可有二项分布概率公式推导得出,其中λ=np,当n>>p时, 
p(k)=(nk)pk(1p)nk=n!pk(1p)nkk!(nk)!=n!(λn)k(1λn)nkk!(nk)!=λkk!n!(nk)!k!(1λn)n(1λn)k

n->时,λn->0,n!(nk)!k!->1,(1λn)n->eλ(1λn)k->1,所以 
p(k)>λkeλk!

泊松分布的期望和方差均为λ,证明过程严格按照定义即可,注意在证明过程中使用到了eλ

       泊松分布主要用来研究单位时间或单位空间内某时间的发生次数,同时事件的发生必须是相互独立的,比如单位时间内通过某一交通灯的车辆数等。λ大概等于20时,泊松分布基本可以近似为正态分布进行处理。 
       泊松分布用来衡量事件的稳定性是一个不错的方法,再配合一些统计学上的检验方法,能够做很多东西,在之后的连续型随机变量中,有一种分布叫指数分布,它与泊松分布密不可分,可由泊松分布推导出…..敬请期待.

阅读全文
0 0
原创粉丝点击