文本分析常用R包的安装(Rweibo、wordcloud、tm、tmcn、Rwordseg、Rcharts、xlsx、XLConnect)

来源:互联网 发布:mac版axure8.0注册码 编辑:程序博客网 时间:2024/04/28 17:31

     为了使用文本分析挖掘,必须要先安装一些R包,比如Rwordseg包常用于分词、tmcn用于词频统计、wordcloud用于绘制文字云。在R中,有些包是需要额外设置安装的,且设置起挺麻烦的,因此,以下总结并共享了一些解决方法,以供大家参考。

系统测试环境:

  • win10 64bit
  • R x64 3.3.2
  • Java 1.8.0_91-64bit

0.前置操作:

首先,要安装R软件,下载地址:https://www.r-project.org/

其次,需设定scan镜像,安装完成后打开R软件,在程序包-设定scan镜像菜单中选择镜像设定地址

          比如可以选择为:China Beijing4 [https],它是R设在中国北京的第4台服务器。

然后,可以开始以下的安装了,当界面中有提示“ 程序包‘XXX’打开成功,MD5和检查也通过”或者“DONE (XX)”时表示安装成功

1、Rweibo包的安装

由于Rweibo依赖于RCurl、XML、rjson、digest这四个包,需要先装上后再装Rweibo包,执行代码如下:

install.packages("bitops") #RCurl的依赖 

install.packages("RCurl")  

install.packages("XML")  
install.packages("rjson")  
install.packages("digest")  

install.packages("Rweibo",repos="http://R-Forge.R-project.org")

执行完成后加载library就可以用哒,代码如下:

library(Rweibo) 

2、wordcloud包的安装

wordcloud包R自带,执行代码如下:

install.packages("wordcloud")  

执行完成后同样需要加载library才能使用此包,代码如下:

library(wordcloud)

3、tm包的安装

与wordcloud包的安装方法相同,代码如下:

install.packages("tm")  

library(tm)

4、tmcn包的安装

下载源码.zip文件,在R中采用本地安装方式进行安装

Rwordseg.zip下载地址:https://r-forge.r-project.org/R/?group_id=1571

注意:”install.packages("tmcn", repos="http://R-Forge.R-project.org",type="source")“及jar包无法直接解析

5、Rwordseg包的安装

第一步:安装好Java环境及rJava包,并确定rJava包的可用性

先要安装和配置Java环境,参考方法:http://jingyan.baidu.com/article/e75aca85b29c3b142edac6a8.html

                    jdk下载地址:http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html

然后执行以下命令:

install.packages("rJava")  #Rwordseg的依赖 

rJava包的测试:

如遇到rJava包的错误,一般是java安装版本问题或者环境变量设置问题

相关测试可以参考:http://blog.fens.me/r-rjava-java/

第二步:下载源码.zip文件,在R中采用本地安装方式进行安装

Rwordseg.zip下载地址:https://r-forge.r-project.org/R/?group_id=1054

注意:“install.packages("Rwordseg",repos="http://R-Forge.R-project.org")”及jar包均无法直接解析

Rwordseg包的测试:

    > library(Rwordseg)
    载入需要的程辑包:rJava
    # Version: 0.2-1
    > teststring1 <- "花儿为什么这样红"
    > segmentCN(teststring1)
    [1] "花儿"   "为什么" "这样"   "红"    

6、Rcharts包的安装:

方法一:从本地安装,需要先下载好RJSONIO包和Rcharts包后

在工具栏里面“程序包”--》“从本地文件安装程序包”,

之后,选择本地下载好的两个文件进行安装,先安装依赖包RJSONIO包,再安装Rcharts包。

Rcharts包的测试:

library(Rcharts)

方法二:从GitHub上安装。

由于rCharts包目前并没有收录进scan中,而是托管在GitHub上,所以需要先安装devtools包:

    > install.packages("devtools")
    > library(devtools)
    # 使用devtools包进行rCharts包的安装
    > devtools::install_github('ramnathv/rCharts')

另外,rCharts包的绘图函数类似lattice包,通过formula、data指定数据源和绘图方式,并通过type指定图表类型。其基本格式如下:

    > graph_function(formula,data=,option)

Rcharts包交互可视化学习参考地址如下:https://zhuanlan.zhihu.com/p/24042457


7、xlsx包的安装(XLConnect包类似于xlsx包)

第一步:安装好Java环境及rJava包,并确定rJava包的可用性,同第5点第一步所述,需将Java与R安装在同一位置,否则会报错;

第二部:安装xlsx包。如果提示xlsxjars包未自动装上也需要先手动安装一下。

    > install.packages("rJava")

    > install.packages("xlsxjars")

    > install.packages("xlsx")

8、XLConnect包的安装

XLConnect包类似于xlsx包的安装,但XLConnet包需要在xlsx包OK的前提下使用,因此应先装好xlsx包再安装XLConnect包,否则使用时可能出错。

第一步:按照第7点先装好xlsx包。

第二步:安装XLConnect包。如果提示xlsxjars包未自动装上也需要先手动安装一下。

    > install.packages("XLConnectJars")

    > install.packages("XLConnect")


PS: 本文中所提到的相关软件包已分享至百度云盘,包括文件分析R包、R安装包、Java安装包

分享地址:http://pan.baidu.com/s/1c1142Gg

提取密码:i15u


0 0