mahout开发环境搭建

来源:互联网 发布:rca纸带耐磨试验机淘宝 编辑:程序博客网 时间:2024/05/01 23:35

1:java版本选择

选择1.6版本,ide选择eclipse

2:安装maven

选择二进制包,解压后添加M2_HOME和M2环境变量,参见maven的官网,在/etc/profile的PATH添加maven的bin路径,我的是如下设置的PATH=$PATH:/opt/apache-maven-3.0.3/bin

3:安装mahout

解压

mvn install

如果jdk使用的是1.7,会有两个bug编译不过去:

第一个需要打一个补丁,地址参见:https://issues.apache.org/jira/browse/MAHOUT-782

打补丁方法很简单,在linux下patch 源文件 补丁文件即可

第二个:vim taste-web/pom.xml,加入

<plugin>    <groupId>org.apache.maven.plugins</groupId>    <artifactId>maven-war-plugin</artifactId>    <version>2.1.1</version></plugin>

4:mahout和eclipse集成

m2eclipse只能选http://m2eclipse.sonatype.org/sites/m2e的安装,否则pom.xml报错,解决起来会哭死的

eclipse版本应选择EE版本的,这个不带maven插件,选了其它版本带插件了,想卸载可能比较难,不如下个ee版本的

具体如何集成请参考https://cwiki.apache.org/confluence/display/MAHOUT/BuildingMahout

5:安装hadoop

其它安装方式都不太对,用这个博客的应该可以,中间有些地方写的不对的应该很容易解决

http://www.54chen.com/_linux_/hive-hadoop-how-to-install.html

6:运行例子

如果上面步骤都没问题,那就运行吧,我的是mahout 0.6版本的,如何例子的链接https://cwiki.apache.org/confluence/display/MAHOUT/Quickstart#FootnoteMarker1,点开一个照着做就行了,我是一遍运行成功的,有问题的别找我


原创粉丝点击