零基础学习Mahout之一:搭建单机环境

来源:互联网 发布:搜索引擎优化排名 编辑:程序博客网 时间:2024/05/30 05:16

    为了能彻底的学懂《mahout实战》这本书,实验必不可少。但做为零基础的人,首先要解决的就是开发环境的问题,有了好的实验环境,对书中所提的例子,运用起来才会得手应手。逍遥选择的是Windows+Eclipse+Maven+Mahout单机环境。这篇文章将记录逍遥是如何搭建环境,便于和正常学习Mahout的朋友交流,也便于自己日后复习。

一、安装Eclipse

Eclipse的下载地址为:http://www.eclipse.org/downloads/,选择标准版就行。我选择的是“Eclipse IDE for Java EE Developers”版本。(至于各个版本有什么区别,逍遥还不是很懂)

安装完后运行Eclipse,为后续的安装做好准备。

Version: Luna Service Release 2 (4.4.2)
Build id: 20150219-0600


二、安装Maven插件

因为下载的版本是目前发布的最新版本,已经集成了m2eclipse插件,也就自动附带了Maven插件了。可以在help-->about Eclipse-->Installation Details中找到相关信息,也可以从new -->project-->maven选项中得到验证


三、安装mahout

mahout下载地址为:http://mahout.apache.org/

下载的版本为:mahout-distribution-0.9

解压到特定的文件夹中,如:F:\mahout-distribution

四、使用Maven构建Mahout项目

l 通过菜单File > New > Project新建项目,选择MavenProject


l 直接Next


l 选择maven-archetype-quickstart


l 输入GroupId和ArtifactId,可以根据自己喜好随便命名:如test


l 点了Finish后,Eclipse便会创建如下一个工程:


五、导入mahout文件

l  选中test项目-->右击-->properties-->Java Build Path--->Libraries菜单项


l  选择Add External JARS按钮--> 从第三步解压目录中选择特定文件:mahout-core-0.9.jar、mahout-core-0.9-job.jar、mahout-integration-0.9.jar、mahout-math-0.9.jar


l  导入后的目录结果如下


六、修改代码

修改com.mine.mahout.test包中的APP.JAVA文件Main函数中的内容

package com.mine.mahout.test;import java.io.File;import java.util.List;import org.apache.mahout.cf.taste.impl.model.file.FileDataModel;import org.apache.mahout.cf.taste.impl.neighborhood.NearestNUserNeighborhood;import org.apache.mahout.cf.taste.impl.recommender.GenericUserBasedRecommender;import org.apache.mahout.cf.taste.impl.similarity.PearsonCorrelationSimilarity;import org.apache.mahout.cf.taste.model.DataModel;import org.apache.mahout.cf.taste.neighborhood.UserNeighborhood;import org.apache.mahout.cf.taste.recommender.RecommendedItem;import org.apache.mahout.cf.taste.recommender.Recommender;import org.apache.mahout.cf.taste.similarity.UserSimilarity;public class App {public static void main(String[] args) {try {// 从文件加载数据DataModel model = new FileDataModel(new File("e:\\data.csv"));// 指定用户相似度计算方法,这里采用皮尔森相关度UserSimilarity similarity = new PearsonCorrelationSimilarity(model);// 指定用户邻居数量,这里为2UserNeighborhood neighborhood = new NearestNUserNeighborhood(2,similarity, model);// 构建基于用户的推荐系统Recommender recommender = new GenericUserBasedRecommender(model,neighborhood, similarity);// 得到指定用户的推荐结果,这里是得到用户1的两个推荐List<RecommendedItem> recommendations = recommender.recommend(1, 2);// 打印推荐结果for (RecommendedItem recommendation : recommendations) {System.out.println(recommendation);}} catch (Exception e) {System.out.println(e);}}}

七、运行程序

选择程序运行Run As -->JavaApplication 


结果如下

以上就是案例的整个过程,希望能帮助到正常学习Mahout的朋友,请大家注意,运行结果中有红色的信息,这是什么原因呢?等逍遥解决后,会在下一篇给出答案,同时欢迎大家评论,提出不足,便于提高,邮箱:cdazcl@163.com欢迎您的来信。讨论群:242848749

附录:

本文参考:http://www.cnblogs.com/freefalcon/p/3893590.html?utm_source=tuicool

测试文件:data.csv放到E盘中,内容如下

1,101,51,102,31,103,2.52,101,22,102,2.52,103,52,104,23,101,2.53,104,43,105,4.53,107,54,101,54,103,34,104,4.54,106,45,101,45,102,35,103,25,104,45,105,3.55,106,4


0 0