JAVA调用R语言

来源:互联网 发布:网络歌手好听的歌 编辑:程序博客网 时间:2024/06/05 20:35

1 简介

R是统计计算的强大工具,而JAVA是做应用系统的主流语言,两者天然具有整合的需要。关于整合,一方面,R中可以创建JAVA对象调用JAVA方法,另一方面,JAVA中可以转换R的数据类型调用R的函数,互相取长补短。现在也有一个项目JGR,用JAVA做R的图形界面,可以实现高亮显示自动补全等,还能让JAVA和R互相调用。

关于R中调用JAVA,我想主要是为了利用其面向对象的特性,毕竟R语言近来很致力于向面向对象发展,有个很好的项目rJava可以实现,在www.rforge.net/rJava上。R中调JAVA对我似乎意义不大,本文主要介绍JAVA中调用R。

 JAVA很适合开发应用系统,但是数学建模和计算能力非其所长,如果该系统需要进行大量的统计或者优化的计算,调用R是一种很好的方式。JAVA负责系统的构建,R用来做运算引擎,从而实现应用型和分析性相结合的系统。

 目前网上有两种方式使用java调用R。

2       Rserve的方式

2.1     介绍

首先要介绍的是Rserve的方式,这是一个基于TCP/IP的服务器,通过二进制协议传输数据,可以提供远程连接,使得客户端语言能够调用R。目前Rserve作为一个package发布在CRAN上,可以直接使用install.packages("Rserve")进行安装。需要使用时在R控制台下加载该包,然后输入命令Rserve(),开启服务器,就可以供客户端调用。

其客户端可以有多种,这里只介绍JAVA客户端。最早的客户端包是JRclient,在www.rosuda.org/Rserve上还可以下载到,但是现在该项目全部移到了www.rforge.net/Rserve,使用REngine作客户端(和JRI一致),在该网站下可以下载到REngine.jar和RserveEngine.jar两个文件。如果用eclipse开发的话,在工程属性中导入这两个外部的jar包,就可以正常使用了。

首先建立一个新的连接,然后就可以使用eval之类的方法将R中的表达式传到服务器端,通过R求值后传回JAVA中REXP类型的变量,然后打印出来,整个过程非常简单。由于不需要对R进行初始化,因此速度会比较快。在其他系统下可以同时建立多个连接,但是在Windows下只允许同时打开一个连接,后续的连接都会共有相同的命名空间。官网上不建议在Windows下使用Rserve,因为会丧失很多性能,他们推荐可以考虑DCOM的方式。不过DCOM那个工程没有现成的jar包可用,其实如果是拿R做分析系统中的运算引擎,单连接够用了。

2.2     操作步骤

(一)   在R里下载“Rserve”包,并安装

安装好后,

运行如下命令启动“Rserver”

 

> library(Rserve)

> Rserve()

 

 

Starting Rserve...

 "D:\PROGRA~1\R\R-30~1.1\library\Rserve\libs\i386\Rserve.exe" 

 

(二)   建立java工程,导入必要的包,写出测试用例

目录结构如下(标红色的是需要的):

 

Test.java 内容

package com.rTest;

 

import org.rosuda.REngine.REXP;

import org.rosuda.REngine.Rserve.RConnection;

 

public class Test {

    public static void main(String[] args) {

       try {

           RConnection c = new RConnection();

           REXP x = c.eval("R.version.string");

           System.out.println(x.asString());

       } catch (Exception e) {

            e.printStackTrace();

       }

    }

}

运行即可

2.3     可能出现的错误

2.3.1  Connection refused: connect

org.rosuda.REngine.Rserve.RserveException: Cannot connect: Connection refused: connect

    at org.rosuda.REngine.Rserve.RConnection.<init>(RConnection.java:88)

    at org.rosuda.REngine.Rserve.RConnection.<init>(RConnection.java:60)

    at org.rosuda.REngine.Rserve.RConnection.<init>(RConnection.java:44)

    at com.rTest.Test.main(Test.java:9)

 

这是由于“Rserve” 服务器没有启动起来的原因,试试在R内运行如下语句

 

> library(Rserve)

> Rserve()

 

3       JRI 的方式

3.1     介绍

另一种方式是JRI,全名是Java/R Interface,这是一种完全不同的方式,通过调用R的动态链接库从而利用R中的函数等。目前该项目已经成了rJava的子项目,不再提供单独的JRI的版本。因此使用时简单地通过install.packages("rJava")安装rJava就行,在安装文件夹中,可以看到一个jri的子文件夹,里面有自带的例子可以用来测试。

装好后要修改系统的环境变量,在PATH中添加%R_HOME%/bin和%R_HOME%/library/rJava/jri,注意R_HOME的路径要正确,重启系统使之生效。使用时同样在eclipse里导入外部的jar包(在www.rforge.net/rJava下载JRI.jar、REngine.jar和JRIEngine.jar这三个文件),在rJava包安装目录下的jri/examples里有现成的例子(rtest.java和rtest2.java),可以测试是否成功。

3.1.1 install.packages("rJava")安装rJava(如第一种方式一样选择镜像安装)
clipboard[47]
3.1.2 安装完成后再安装目录可以在R的安装目录看到如下的目录结构:
clipboard[48]
3.1.3 接下来依据这个目录结构设置环境变量:
R_HOME=C:\Program Files\R\R-3.3.1
clipboard[49]
PATH后添加C:\Program Files\R\R-3.3.1\bin\x64;C:\Program Files\R\R-3.3.1\library\rJava\jri;(可以用%R_HOME%的写法),但是要特别注意“bin\x64”,系统是64就指定x64文件夹,32位就指定i386文件夹,否则会找不到依赖库;同理rJava\jri下用的dll文件也要与计算机位数一致;
clipboard[50]
clipboard[51]
3.1.4 环境变量配置完成后把安装目录下jri文件夹下的JRI.jar、REngine.jar和JRIEngine.jar放进Java工程添加到编译路径。到这里Java调用R的桥梁就搭建好了;
clipboard[52]


3.2  重要的一步 Spring MVC的项目中调用语言

  可以说大多数的开发人员最重要的目的就是把这个rjava运用到项目中去。在这个步骤中,我将这个调用的方法写成了一个工具类,但是我遇见了两个大的问题,第一个,因为在项目是在tomcat中发布的,所以tomcat在加载的时候没有找到R的.dll文件,这个问题可以通过System.out.println(System.getProperty("java.library.path"));这句话,找到你用的那个tomcat下面加载文件的目录,将这个jri.dll放进去,重新运行这个就行了。第二个,是我在写工具类的时候发生的一个错误,我没有考虑到自己会多次使用到这个工具,从而导致我的电脑启动了很多个JVM,内存溢出,死机。这个问题,是通过一个单例模式的建立来解决的,我只让这个Rengine在项目中被实例化一次,这样子,他就只能被启动一次,不会导致电脑死机等等   

一定要注意jdk的配置路径,确保环境变量的正确性。


3.3     可能出现的错误

3.3.1  Cannot find JRI native library!

Press <Enter> to continue (time to attach the debugger if necessary)

 

Creating Rengine (with arguments)

Cannot find JRI native library!

Please make sure that the JRI native library is in a directory listed in java.library.path.

 

java.lang.UnsatisfiedLinkError: no jri in java.library.path

    at java.lang.ClassLoader.loadLibrary(ClassLoader.java:1860)

    at java.lang.Runtime.loadLibrary0(Runtime.java:845)

    at java.lang.System.loadLibrary(System.java:1084)

    at org.rosuda.JRI.Rengine.<clinit>(Rengine.java:19)

    at com.rTest.rtest2.main(rtest2.java:73)

检查下path是否正确,如果正确 ,如果配置环境正确,1)用System.out.println(System.getProperty("java.library.path"));输出java.library.path,结果如下:

D:\develop\Java\jdk1.7.0_40\bin;D:\develop\Java\apache-tomcat-8.0.0-RC5\bin

这个信息中的前者是java的安装目录,后者是tomcat的安装目录,把jri.dll分别拷到这两个目录。然后测试问题是否解决。




原创粉丝点击