mahout配置

来源:互联网 发布:mac队装备 编辑:程序博客网 时间:2024/05/21 06:51

1、下载文件

2、tar -xvz -f mahout-distribution-0.7.tar.gz -C .   其中-C之后的参数即.的位置是解压的目标文件夹

3、配置环境变量   /etc/profile或者./.bashrc文件都可以

    export HADOOP_HOME=/home/myname/hadoop-1.0.4

    export HADOOP_CONF_DIR= $HADOOP_HOME/conf

    export MAHOUT_HOME=/home/myname/mahout-0.7  

第三条本人在一开始配置的时候没有加,也没出什么问题

4、安装完成后测试环节:

        (1)、下载文件http://archive.ics.uci.edu/ml/databases/synthetic_control/synthetic_control.data放在$MAHOUT_HOME目录下。

         (2)、启动Hadoop:$HADOOP_HOME/bin/start-all.sh

         (3)、在$MAHOUT_HOME目录下创建测试目录testdata,并把数据导入到这个tastdata目录中(这里的目录的名字只能是testdata)

            $HADOOP_HOME/bin/hadoop fs -mkdir testdata

            $HADOOP_HOME/bin/hadoop fs -put  $MAHOUT_HOME/synthetic_control.data $MAHOUT_HOME/testdata

         (4)、使用kmeans算法(这会运行1分钟左右)

    $HADOOP_HOME/bin/hadoop jar $MAHOUT_HOME/mahout-examples-0.5-job.jar org.apache.mahout.clustering.syntheticcontrol.kmeans.Job

          (5)、查看结果

    $HADOOP_HOME/bin/hadoop fs -lsr output

    $HADOOP_HOME/bin/hadoop fs -get output $MAHOUT_HOME/examples

    $cd $MAHOUT_HOME/examples/output

    $ ls

    如果看到以下结果那么算法运行成功,你的安装也就成功了.

    clusteredPoints  clusters-0  clusters-1  clusters-10  clusters-2  clusters-3  clusters-4

    clusters-5  clusters-6  clusters-7  clusters-8  clusters-9  data