LDA Gibbs Sampling公式推导
来源:互联网 发布:武藏s300点编程 编辑:程序博客网 时间:2024/06/06 19:18
Gibbs Sampling
Background
所有的推导可以说都是根据这张图片:
LDA的目的就是为了在给定
推导1 — 联合分布
求解
两个部分
对于第一部分:
p(x|z,ϕ)=∑Kk=1p(w|zk,ϕk)=∑Kk=1∏Vv=1p(w|zk,ϕk,v)=ϕntkk,v ,其中ntk 表示的是所有文档中属于topic k的词v的个数。p(ϕk|β)=Dir(ϕk|β)=1B(β)∏Vv=1ϕβv−1k,v
所以
而又有因为
能得到
同理,对于第二部分
所以综上
推导2 — 条件分布
求解:
首先,要得到
根据上面,有
所以在固定
所以
又因为
所以能够化简为
同理
所以得到
若
推导3 — 后验
根据Dirichlet和Multi-nomial的共轭性,也就是当先验是Dirichlet,likelihood是Multi-nomial,那么后验也是Dirichlet。也就是先验分布
因此,只要能够识别出对于文档中的每一个单词的隐含主题,就能够求出两个公式。
所以综合上述
Appendix
写完了才发现有高清无码的paperParameter estimation for text analysis
代码实现在这里:github repo
这一章节内容也是参考了另外两篇不错的博客,然后对里面的公式进行更细致的推导
博客1
博客2
- LDA Gibbs Sampling公式推导
- Gibbs Sampling实现LDA
- Lda gibbs sampling --- python
- Gibbs sampling -- batch LDA
- 使用collapsed gibbs sampling对LDA中参数进行估计的推导过程
- 浅谈gibbs sampling(LDA实验)
- LDA-math-MCMC 和 Gibbs Sampling
- LDA-math-MCMC 和 Gibbs Sampling
- LDA-math-MCMC 和 Gibbs Sampling
- LDA-math-MCMC 和 Gibbs Sampling
- LDA Gibbs Sampling 的JAVA实现
- LDA-math-MCMC 和 Gibbs Sampling
- LDA-math-MCMC 和 Gibbs Sampling
- LDA-math-MCMC 和 Gibbs Sampling
- LDA-math-MCMC 和 Gibbs Sampling
- LDA-math-MCMC 和 Gibbs Sampling
- LDA-math-MCMC 和 Gibbs Sampling
- LDA-math-MCMC 和 Gibbs Sampling
- Adobe阅读器渗透实战
- Java Note: 多线程的同步(互斥锁)的方法对比,信号量锁,读写锁的实现,生产者-消费者模式的实现
- Java Notes: BlockingQueue and 生产者消费者模式
- 并发方法之 非阻塞同步算法与CAS(Compare and Swap)无锁算法
- 【数据结构与算法】小于等于k的最大连续子序列和
- LDA Gibbs Sampling公式推导
- 【Leetcode】363. Max Sum of Rectangle No Larger Than K
- 切片用例笔记
- [Algorithm] 九章一:算法面试与代码风格
- 高中数学:如何计算八个描边圆的位置
- 在没有好方法之前,坚持,成了暂时的别无选择。
- CSDN编辑器语法
- Python轻松入门-24 解包列表
- 后缀.do和.action