从 Poisson 分布到服务器的访问

来源:互联网 发布:淘宝村淘在哪里设置 编辑:程序博客网 时间:2024/05/22 15:00

在时间段(0,t]内,我们来考察一个大型数据库服务器的任务到达情况。在很短的时间段 Δt 内,假设一个新任务到达的概率为 λΔt是合理的。λ是一个定值,且大小取决于服务器的用户数。如果 Δt 足够小,在 Δt 时间内到达两个或者两个以上的任务的概率非常小(言下之意就是到达一个或者不到达),可以忽略不计。我们感兴趣的是在时间 t 内到达 k 个任务的概率。

假设时间段(0,t]分割为 n 个子时间段,每个子时间段长为 tn进一步假设在给定的时间段内任务的到达与其他时间段内的任务到达是彼此独立的。那么对于足够大的 n ,我们可认为这 n 个时间段构成了一个 Bernoulli 试验序列,并且试验成功的概率为 p=λtn。由此可知,在 n 个大小为 t/n 的时间段内有 k 个任务到达的概率约为:

b(k;n,λtn)=(nk)(λtn)k(1λtn)nk

因为当且仅当 t/n 非常小时,每个子时间段内到达任务个数超过 1 的概率才可以忽略,这时上述假设才是合理的,我们将对上述 PMF 取 n 的极限值:
b(k;n,λtn)===n(n1)(nk+1)k!nk(λt)k×(1λtn)nkn(n1)(nk+1)nk(λt)kk!(1λtn)k(1λtn)neλt(λt)kk!

下面以单个参数 α 代替 λt,又 p=λtn,所以 α=np,得到 Poisson分布的 PMF:
f(k;α)=eααkk!

也即,n 非常大而 p 非常小时,Poisson 分布的 PMF 可以很方便的用来估计二项分布的 PMF,即:

(nk)pk(1p)nkαkeαk!,α=np

其中一个被大家接受的经验法则是如果 n20,p0.05,可以用 Poisson 分布来估计二项分布值。

1. 举例

某厂商生产的 VLSI 芯片的缺陷率为 1%,计算一箱包含 100 个芯片中存在缺陷芯片的概率。

二项分布求解:

转换为对立事件,

1(1000)0.0100.991000.634

Poisson 分布求解:
α=np=1α不直接表示概率,而是频次,出现的次数)

110e10!0.632

0 0
原创粉丝点击