hadoop2.x整合手册【4】---mahout0.9安装部署与测试

来源:互联网 发布:手提电脑屏幕录像软件 编辑:程序博客网 时间:2024/05/16 13:52

基本过程和0.8版本的安装http://blog.csdn.net/xqj198404/article/details/9619265的一致

需要在bin目录下的mahout文件的头部添加如下环境变量

HADOOP_CONF_DIR="hadoop的配置目录需要以/结尾"HADOOP_HOME="hadoop的安装目录需要以/结尾"MAHOUT_HEAPSIZE=2000 mahout可以调用的内存量,建议设的比较大

另外修改hadoop配置目录下的mapred-site.xml的文件,添加如下参数

<name>mapred.child.java.opts</name><value>-Xmx1024m</value></property>
如果是算法计算密集型的,建议超过1024的进行设置,而hadoop默认的200m的设置是不够用mahout使用的

另外修改hadoop配置目录下的hadoop-env.sh的文件,将export HADOOP_HEAPSIZE的注释取消

export HADOOP_HEAPSIZE=2000

设置hadoop的可用内存为2000M

如果仍然在运行mahout中出现java heap space的错误,可以将以上的两项设置的参数依据实际硬件条件设置更大

mahout的验证方法与0.8版本方法相同

0 0