LDA之我见
来源:互联网 发布:linux中重启mysql命令 编辑:程序博客网 时间:2024/05/21 14:02
本文纯粹出于个人理解,公式纯手打难免有误,不对的地方请指出。
LDA认为一个语料库中的某个文档w又一系列的主题z生成的,而这一系列的主题是潜在的不可见的,其实就是个混合模型:
在贝叶斯的理论框架之下,将z的参数也当作变量:
那么概率模型雏形就出来了,LDA是一个典型“词带”的模型,即对文档词w作条件独立假设:
其中
那么对于整个语料库D:
到这里,整个LDA的模型就已经构建结束,模型的训练和大部分混合模型类似,采用EM去估计:
在计算z的后验分布时候,会发现这个计算量随着w的数量呈指数增长,因此为了缩减计算量,用一个近似分布来逼近这个真实的后验分布,比如拉普拉斯近似,或者变分推断的方法(详见,另一篇变分推断)。
0 0
- LDA之我见
- topic model之LDA
- 自然语言处理之LDA
- 主题模型之LDA
- 软件测试之我见
- 学校课程设计之我见
- 项目经理之我见
- Java性能之我见
- 地产泡沫之我见
- 项目经理之我见
- 软件设计之我见
- 移动开发之我见
- 国外电影之我见
- singleton之我见
- SiteMesh 之我见
- jsp template之我见
- jsp template之我见
- 游戏策划之我见
- Fresco源码分析-SimpleDraweeView在ListView里怎么释放内存的?
- Maven属性分析
- MySQL日志分析
- Bat批文件处理
- Java基础--循环
- LDA之我见
- MoveIt在rbx2上的学习
- 从朋友圈看女神的情感状态
- php基础之函数入门
- Maven版本约定
- dubbo 监控中心和admin部署
- duilib入门问题集
- WebView上传文件遇到的坑openFileChooser
- 一种常见的javascript库的语法