Gaussian LDA(1): LDA回顾以及变分EM

来源:互联网 发布:欧姆龙plc编程语言 编辑:程序博客网 时间:2024/05/17 02:18
Latent Dirichlet Allocation (LDA)是一个主题模型,能够对文本进行建模,得到文档的主题分布。常用的模型参数估计方法有Gibbs Sampling和Variational Inference,网上有非常多关于LDA的介绍,最为经典的例如Rickjin的《LDA数学八卦》。本文旨在推导变分EM的全部过程。

转载请注明出处:http://blog.csdn.net/u011414416/article/details/51168242

本文参考了Blei在2003JMLR上发表的LDA论文,Blei文中并没有关于对beta加了先验的情况进行推导。本文的推导基于smoothed LDA(即对主题-词分布beta也施加了Dirichlet先验eta)。如有错误,欢迎指正。

1
2
3
4
5
6
7
8
9
10
11
12
13

3 0