gensim的LSI模型来计算文档的相似度
来源:互联网 发布:淘宝一元拍卖真的吗 编辑:程序博客网 时间:2024/05/29 15:31
- from gensim import corpora,models,similarities
- dictionary=corpora.Dictionary.load('/tmp/deerwester.dict')
- corpus=corpora.MmCorpus('/tmp/deerwester.mm')
- print(corpus)
- lsi=models.LsiModel(corpus,id2word=dictionary,num_topics=2)
- doc="human computer interaction"
- vec_bow=dictionary.doc2bow(doc.lower().split())
- vec_lsi=lsi[vec_bow] #convert the query to LSI space
- print(vec_lsi)
- #transform corpus to space and index it
- index=similarities.MatrixSimilarity(lsi[corpus])
- index.save('/tmp/deerwester.index')
- sims=index[vec_lsi]
- sims=sorted(enumerate(sims),key=lambda item:-item[1])
- from pprint import pprint
- pprint(sims)
利用gensim的LSI模型计算文档的相似度
0 0
- gensim的LSI模型来计算文档的相似度
- gensim的LSI模型来计算文档的相似度
- 使用gensim计算文档的相似度
- gensim的主题模型LSI
- lsi计算文档相似度
- Ubuntu上使用gensim计算文档间的相似度
- 使用Gensim建立bow TFIDF LSI模型对文本相似度计算
- gensim similarity计算文档相似度
- 基于gensim模块的中文句子相似度计算工具
- 计算文档的相似度
- 利用gensim主题模型寻找相似的coursera课程
- 计算两个文档的相似度
- 如何计算两个文档的相似度
- 用gensim对中文维基百科语料上的word2Vec相似度计算实验
- 向量空间模型(VSM)在文档相似度计算上的简单介绍
- 向量空间模型(VSM)在文档相似度计算上的简单介绍
- 向量空间模型(VSM)在文档相似度计算上的简单介绍
- 向量空间模型(VSM)在文档相似度计算上的简单介绍
- oracle数据库出现的一些问题
- android5.0源码开发之自定义低电量警告AlertDialog
- 计算n!中结尾零的个数
- MySQL学习6_ERROR! MySQL server PID file could not be found!解决方法
- 第3周实践项目4 - 顺序表应用(2)
- gensim的LSI模型来计算文档的相似度
- 对于viewport的理解
- 工具方法:下载文件时碰到相同文件,文件名增加(1) 如果有(1)则下载文件名后缀(2)
- android 图片缩放
- git 分支创建和管理
- Java源码String类lastIndexOf方法的分析
- JAVA classLoader
- 安卓的数字签名技术
- linux 信号