wordcloud用来制作中文词云
来源:互联网 发布:jre 7u9 windows xp32 编辑:程序博客网 时间:2024/05/16 00:42
1. 读入数据,删除NAN,用jieba分词df = pd.read_csv("./data/entertainment_news.csv", encoding='utf-8')dfdf = df.dropna()dfcontent=df.content.values.tolist()content#jieba.load_userdict(u"data/user_dic.txt")segment=[]for line in content: try: segs=jieba.lcut(line) for seg in segs: if len(seg)>1 and seg!='\r\n': segment.append(seg) except: print line continue
2. 去掉停用词words_df=pd.DataFrame({'segment':segment})#words_df.head()stopwords=pd.read_csv("data/stopwords.txt",index_col=False,quoting=3,sep="\t",names=['stopword'], encoding='utf-8')#quoting=3全不引用#stopwords.head()words_df=words_df[~words_df.segment.isin(stopwords.stopword)]words_df3. 统计计数
words_stat=words_df.groupby(by=['segment'])['segment'].agg({"计数":numpy.size})words_stat=words_stat.reset_index().sort_values(by=["计数"],ascending=False)words_stat.head()4. 绘图wordcloud=WordCloud(font_path="data/simhei.ttf",background_color="white",max_font_size=80)word_frequence = {x[0]:x[1] for x in words_stat.head(1000).values}wordcloud=wordcloud.fit_words(word_frequence)plt.imshow(wordcloud)
阅读全文
0 0
- wordcloud用来制作中文词云
- wordcloud用来制作词云
- Python wordcloud之中文词云
- Python NLPIR2016 与 wordcloud 结合生成中文词云
- Python实现中文词云(wordcloud),根据背景图片生成词云
- 数据库多对多 一对多 建表 sublimeText 输出不全 wordcloud 中文词云为乱码
- NLP01-python的wordcloud实现中文词云小例
- 【python入门】制作一个自定义的中文词云
- python中文词云生成
- R中文词云包wordcloud2试用
- PyTagcloud工具使用——显示中文词云
- 微信聊天机器人、Python、中文词云
- 利用Python将已有TXT文档生成中文词云
- 用Python做简易的中文词云
- python wordcloud 对电影《我不是潘金莲》制作词云
- 使用python的wordcloud包实现中文标签云制作
- Python使用wordcloud+pillow基于给定图像制作词云
- 在python上使用wordcloud制作自己的词云
- HTML学习笔记(三)
- 【1062】计算距离:曼哈顿
- Docker容器的持久存储模式
- 大数据(三十七)机器学习【机器学习语言】
- Android 从external storage加载so文件
- wordcloud用来制作中文词云
- java怎么得到字符对应的char值
- GoLand软件的免激活使用
- 数论之因子个数的求法
- Effective C++解析 Item3:尽量使用const (补充)物理的与逻辑的常量性
- docker容器的时间问题
- 大数据时代如何提升研发效率
- 计算机启动与BIOS
- 【笔记】Sqoop 脚本开发规范