深入浅出LDA(3)

来源:互联网 发布:淘宝批发市场进货渠道 编辑:程序博客网 时间:2024/05/29 03:36

  • 阅读说明
  • 前几节的一点小尾巴
  • Dirichlet分布
    • 1 回顾beta分布
    • 2 Dirichlet分布
      • 21 Dirichlet分布推导
      • 22 beta分布与Dirichlet分布
    • 3 如何更好的理解这个分布

0. 阅读说明

与LDA紧密相关的必要且最小知识集合为博文的正文。凡是灰色框中的内容为拓展和补充内容,直接跳过并不会影响你的理解。灰色框指的是如下形式的段落:

这是一个灰色框示意段落
这部分内容为补充性内容,直接跳过并不会影响你的理解

1. 前几节的一点小尾巴

在第一节中,我们从二项分布推导Gamma 分布的时候,使用了如下的等式:

P(Ck)=n!k!(nk1)!1ptk(1t)nk1dt,CB(n,p)

现在大家可以看到,左边是二项分布的概率累积,右边实际上是β(t|k+1,nk)分布的概率积分。这个式子之前并没有给出证明,下面我们进行证明
我们可以如下构造二项分布,取随机变量 看X1,X2,,XniidUniform(0,1),一个成功的贝努利实验就是 Xi<p,否则表示失败,于是成功的概率为p用于计数成功的次数,于是CB(n,p)

这里写图片描述

显然我们有如下式子成立:
P(Ck)=P(X(k+1)>p)

此处X(k+1)是顺序统计量,为第k+1大的数。等式左边表示贝努利实验成功次数最多k次,右边表示第 k+1大的数必然对应于失败的贝努利实验,从而失败次数最少是nk次,所以左右两边是等价的。由于X(k+1)Beta(t|k+1,nk), 于是
P(Ck)=P(X(k+1)>p)=1pBeta(t|k+1,nk)dt=n!k!(nk1)!1ptk(1t)nk1dt

以上证明内容来自:LDA-math-认识Beta/Dirichlet分布(2)


2. Dirichlet分布

2.1 回顾β分布

这里写图片描述

此时X(k)的分布即为β分布

2.2 Dirichlet分布

这里写图片描述
此即为Dirichlet分布


2.2.1 Dirichlet分布推导

以下内容来自:
LDA-math-认识Beta/Dirichlet分布(3)

这里写图片描述
这里写图片描述
这里写图片描述


这里写图片描述


2.2.2 β分布与Dirichlet分布

β分布可以看作Dirichlet分布在二维时的特例。
这里写图片描述


这里写图片描述


2.3 如何更好的理解这个分布?

原创粉丝点击