【论文阅读:LDA】The Author-Topic Model for Authors and Documents_2004(ATM经典论文)

来源:互联网 发布:棉花糖srx-9数据 编辑:程序博客网 时间:2024/06/03 14:10
综述:
ATM(author topic mode)的经典文章。

具体:
在传统LDA模型的基础上,加入author的概念。传统LDA模型,是描述文档和词(文档组成元素)之前的关系,这种关系用主题(topic)来衔接和描述。这篇文章加入author的概念。即一篇文章可能有多个author,一个author可能有多个文章,词是文章的组成元素,那么,ATM模型,通过topic描述了author和词之间的关系。
LDA模型的产出:1. doc-topic分布;2. topic-word分布
ATM模型的产出:1. author-topic分布;2. topic-word分布
个人评述:感觉作者只是换了个概念。如果把同一个author的多篇文章进行合并,看成一个doc,那么整个模型又是传统的LDA模型了。

作用:
  1. 应用在学术论文上,自动计算学者的熟悉的领域,即从author-topic分布中选择(1)概率显著的topic;(2)从这些topic中,根据topic-word分布选择topn word。
  2. 对于学术论文,自动推荐审稿人。在1的结果的基础上,根据论文的关键词,找到对应领域的审稿人。
0 0