专业英语学习笔记(1)

来源:互联网 发布:存档软件安卓版 编辑:程序博客网 时间:2024/05/01 15:05

KDD (Knowledge Discovery and Data Mining) 知识发现与数据挖掘

SIGKDD 知识发现与数据挖掘会议,KDD 是其前身

RNN 循环神经网络

CNN 卷积神经网络

DNN 深度神经网络

TF-IDF ( Term Frequency - Inverse Document Frequency )
Term Frequency 关键词的频率 或 单文本词频
Inverse Document Frequency 逆文本频率指数

LSI ( Latent Semantic Index ) 潜语义标号,它是奇异值分解(Singular Value Decomposition, SVD)在文本特征矩阵中应用的产物。

LDA ( Latent Dirichlet Allocation ) 隐含狄利克雷分布。它是一种文档主题生成模型,也称为一个三层贝叶斯概率模型,包含词、主题和文档三层结构。所谓生成模型,就是说,我们认为一篇文章的每个词都是通过“以一定的概率选了某个主题,并从这个主题中以一定概率选择某个词语”这样一个过程得到的。

word2vec Google发布的一个将深度学习应用在自然语言处理的开源项目,详细的讯息参考http://blog.csdn.net/mytestmy/article/details/26961315

原创粉丝点击