搭建RHadoop环境
来源:互联网 发布:用友软件u8教程 编辑:程序博客网 时间:2024/06/05 03:49
我们想通过R分析Hadoop上的数据。有个开源项目完成这些点击打开链接
初始化java环境:
R CMD javareconf
之后进入R:
R
可能需要安装下列依赖包:
install.packages("rJava")install.packages("iterators")install.packages("itertools")install.packages("digest")install.packages("RJSONIO")install.packages("functional")install.packages("bitops")install.packages("caTools")install.packages("plyr")install.packages("stringr")install.packages("Rcpp")install.packages("reshape2")
上面的安装方式为在线安装,自动下载依赖包。
如果是离线,则需要下载包放到指定目录,然后使用下列Shell命令逐个安装;
R CMD INSTALL pkg-tar/rmr2_3.1.2.tar.gz
上面命令安装rmr包,rhdfs和rhase的包类似(值得注意的是,这三个包有较多依赖包,按这三个包之前要先成功安装其他依赖包,根据提示安装即可。)。
完成后,可以通过R命令测试:
library(rhdfs);hdfs.init();hdfs.ls("/");则上面可以浏览HDFS集群上的数据。
(要记得配置下列两个环境变量):
export HADOOP_CMD=/home/dcc/hadoop-2.2.0/bin/hadoopexport HADOOP_STREAMING=/home/dcc/hadoop-2.2.0/share/hadoop/tools/lib/hadoop-streaming-2.2.0.jar
上面指定了需用用到的hadoop命令,以及用到的与HDFS进行数据交互的包(由此可知R是使用streming的方式与HDFS集群进行数据交互)。
0 0
- 搭建RHadoop环境
- RHadoop环境搭建
- RHadoop实践系列之一:Hadoop环境搭建
- RHadoop实践系列之一:Hadoop环境搭建
- RHadoop搭建
- RHadoop搭建(HDFS+MapReduce)
- RHadoop搭建(HBase)
- Rhadoop集群搭建
- rhadoop
- RHADOOP
- rhadoop
- RHadoop
- RHadoop安装
- rhadoop安装
- RHadoop安装
- run rhadoop
- 安装RHadoop
- 环境搭建
- poj3140(树形DP,删边)
- 服务端统一时间戳 boost::date_time UTC
- Android API之Typeface代码演示
- 套接字编程非阻塞
- Html5 中获取镜像图像 - 解决 WebGL 中纹理倒置问题
- 搭建RHadoop环境
- ACdream 1095 EOF女神的相反数(数学:二进制处理)
- My first blog
- mysql错误处理之ERROR 1665 (HY000)
- Android ListView不响应OnItemClickListener解决办法
- 解决eclipse中android添加重载函数时参数为arg0,arg1的问题
- 【splay tree】 UVA 11922 Permutation Transformer
- 忘记MySQL的密码怎么办?
- ubuntu下安装 adobe flash player