R中文词云包wordcloud2试用

来源:互联网 发布:喝茶 知乎 编辑:程序博客网 时间:2024/05/16 05:43


# install R

yum install readline-devel libXt-devel gcc gcc-c++ gcc-gfortran -y
yum install zlib-devel bzip2-devel xz-devel pcre-devel curl-devel openssl-devel -y
wget https://cloud.r-project.org/src/base/R-3/R-3.3.2.tar.gz
tar -xzvf R-3.3.2.tar.gz
cd R-3.3.2

./configure && make && make install


#install wordcloud package
R
>install.packages("devtools")
>devtools::install_git("https://github.com/lchiffon/wordcloud2")
>library(wordcloud2)
>wordcloud2(demoFreq, size = 1,shape = 'star')
>wordcloud2(demoFreqC, size = 2, fontFamily = "微软雅黑", color = "random-light", backgroundColor = "grey")


注释:此处的demoFreqC在data/目录下,通过参考3的方法可看到内部数据结构,是单词和词频的方式,为分词后的结果。实际中需要我们自己处理中文分词的问题。

python版的词云https://github.com/amueller/word_cloud 需要做中文分词改造才可用。


参考:
1. https://github.com/Lchiffon/wordcloud2

2. https://github.com/RevolutionAnalytics/RRO/issues/37 解决通过devtools安装github代码的问题。

3. http://f.dataguru.cn/thread-179897-1-1.html 查看data/demoFreqC.rda样例数据的方法

4. http://blog.csdn.net/lj501886285/article/details/53244108?locationNum=5&fps=1

5. https://cos.name/2016/08/wordcloud2/ 这个写得好

0 0
原创粉丝点击