LAD gensim 主题分析
来源:互联网 发布:济南行知小学位置 编辑:程序博客网 时间:2024/05/18 09:15
# coding: utf-8#from gensim.models import word2vecfrom gensim.corpora import Dictionaryfrom gensim.models import LdaModelfrom gensim import modelsimport sysimport pandas as pdData=pd.read_csv('yuliao.txt',encoding='utf-8',header=None)# In[14]:Listdata=list(Data[0])train_set=[listi.split(' ') for listi in Listdata]# In[40]:reload(sys)sys.setdefaultencoding("utf-8")# In[43]:len(train_set)print('你好')# In[ ]:print('你好')# In[44]:# 构建训练语料dictionary = Dictionary(train_set)corpus = [ dictionary.doc2bow(text) for text in train_set]#构建稀疏向量tfidf = models.TfidfModel(corpus) #统计tfidf # print "lda"corpus_tfidf = tfidf[corpus] #得到每个文本的tfidf向量,稀疏矩阵lda2 = LdaModel(corpus_tfidf, id2word =dictionary, num_topics = 34) #corpus_lda = lda[corpus_tfidf] ## In[19]:print(corpus )# In[22]:# lda模型训练lda = LdaModel(corpus=corpus, id2word=dictionary, num_topics=20)# In[28]:test=lda.print_topics(20)len((test[0]))for i in test: print i[0],i[1]
阅读全文
0 0
- LAD gensim 主题分析
- 文本分析--基于gensim的文本主题模型分析
- 基于gensim的文本主题模型(LDA)分析
- gensim做主题模型
- gensim 主题模型 seed
- Python/gensim主题模型库
- gensim做主题模型
- 主题模型Python工具包:Gensim
- gensim的主题模型LSI
- gensim文本主题模型推荐
- Gensim LDA主题模型实验
- gensim 文档-主题与转换
- 文本分析-gensim
- 文本分析--Gensim概述
- 主题模型TopicModel:通过gensim实现LDA
- Gensim做中文主题模型(LDA)
- 主题模型TopicModel:通过gensim实现LDA
- Gensim简介(提取语义主题)
- Git误删本地master怎么办?
- Storm入门教程(一)
- Java bytecode
- kali下beef使用
- java序列化
- LAD gensim 主题分析
- 最近有感,试试微信公众号与博客互相推广
- windows7 下vmware workstation 12安装Ubuntu16.04虚拟机及安装和共享文件夹
- redis-cli 将内容写入文件中
- 记录一
- altium desing新建自定义PCB大小后,周围的白色部分怎么去掉?白色边框
- C#生成PDF总结
- Mybatis学习(01)-对原生jdbc程序中的问题总结 && mybatis概述
- python里使用正则表达式的嵌套可选模式