Mahout in action读书笔记&Mahout学习笔记

来源:互联网 发布:小额贷款app源码 编辑:程序博客网 时间:2024/05/10 21:43

最近工作中用到一些数据挖掘和机器学习的技术,涉及推荐系统、聚类算法和分类算法。所以打算好好把Mahout学习的过程记录下来,一来方便以后查阅,二来也分享自己的一些心得体会。


一 mahout源码编译

官网 http://mahout.apache.org/ 可以下载到编译后的版本(最新0.9),不过并不兼容最新的hadoop 2.X,所以我需要自己编译。

从git克隆代码

git clone https://github.com/apache/mahout.git

根据网速不同,需要一定的时间,之后运行

mvn -DskipTests=true clean package

会下载大量的依赖jar包,当前的git上代码不支持JDK 1.8编译,会报错,使用JDK 1.7就没有问题了。



耐心等待编译完成即可。

不过还有一个窍门,如果不需要mahout-maths或者mahout-scala相关的包,可以在pom.xml文件中查找module元素,去除掉相关module即可,如图所示。


泡杯咖啡回来,终于出现了全部编译打包成功的画面。



二 导入IDE(Intellij IDEA)

Intellij对maven项目的支持非常好,点击open-然后指定mahout源码目录的pom.xml文件即可完成。




至此,mahout代码的编译和导入到IDE全部完成。











0 0
原创粉丝点击