Eclipse 下mahout的配置与使用

来源:互联网 发布:硬盘播出系统 软件 编辑:程序博客网 时间:2024/05/19 20:47

mahout 是一个开源的旨在为实际问题提供可伸缩性算法的软件。

官方主页:http://mahout.apache.org/

QuickStart:https://cwiki.apache.org/confluence/display/MAHOUT/Quickstart

 

目前的版本是0.4 ,此例展示了在eclipse下如何配置并应用mahout到你的程序中。

 

环境:eclipse +maven(m2eclipse)+ mahout 0.4 +jdk 1.6

 

配置:

 

Step 1: 

       在eclipse中新建一个maven程序 在”Select an Archetype“ 中选择”maven-Archetype-QuickStart“ 即可。

 

 

Step 2:

     打开pom.xml 加入一些必备的jar。 

点击 pom.xml 下的dependencies选项卡,在dependencies出点击add。 在弹出的对话框中输入”mahout“ 稍等片刻就会出来很多的jar包,选择合适的mahout包,一般来说,如果做的很简单的程序,选择mahout-core 就行,如果需要分布计算则需要加入 hadoop。

 

保存pom.xml 这是程序就会自动下载你所选择的jar包。

 

实例:

 

好了我们用一个例子来说明吧:

 

新建一个class 写入以下代码:

 

[java] view plain
  1. import org.apache.mahout.cf.taste.impl.model.file.*;  
  2. import org.apache.mahout.cf.taste.impl.neighborhood.*;  
  3. import org.apache.mahout.cf.taste.impl.recommender.*;  
  4. import org.apache.mahout.cf.taste.impl.similarity.*;  
  5. import org.apache.mahout.cf.taste.model.*;  
  6. import org.apache.mahout.cf.taste.neighborhood.*;  
  7. import org.apache.mahout.cf.taste.recommender.*;  
  8. import org.apache.mahout.cf.taste.similarity.*;  
  9. import java.io.*;  
  10. import java.util.*;  
  11. public class RecommenderIntro {  
  12.     private RecommenderIntro(){};  
  13.       
  14.     public static void main (String args[])throws Exception{  
  15. //      step:1 构建模型 2 计算相似度 3 查找k紧邻 4 构造推荐引擎  
  16.         DataModel  model =new FileDataModel(new File("data/intro.csv"));  
  17.         UserSimilarity similarity =new PearsonCorrelationSimilarity(model);  
  18.         UserNeighborhood neighborhood =new NearestNUserNeighborhood(2,similarity,model);  
  19.         Recommender recommender= new GenericUserBasedRecommender(model,neighborhood,similarity);  
  20.         List<RecommendedItem> recommendations =recommender.recommend(12);  
  21.         for(RecommendedItem recommendation :recommendations){  
  22.             System.out.println(recommendation);  
  23.         }  
  24.           
  25.     }  
  26. }  
 

 

运行结果: 

 

 

RecommendedItem[item:104, value:4.257081]

RecommendedItem[item:106, value:4.0]

 

 

其中intro.csv 的格式如下:

[cpp] view plain
  1. 第一列为UserID ,第二列为ItemID,第三列为Preference Value 即评分  
  2. 1,101,5  
  3. 1,102,3  
  4. 1,103,2.5  
  5. 2,101,2  
  6. 2,102,2.5  
  7. 2,103,5  
  8. 2,104,2  
  9. 3,101,2.5  
  10. 3,104,4  
  11. 3,105,4.5  
  12. 3,107,5  
  13. 4,101,5  
  14. 4,103,3  
  15. 4,104,4.5  
  16. 4,106,4  
  17. 5,101,4  
  18. 5,102,3  
  19. 5,103,2  
  20. 5,104,4  
  21. 5,105,3.5  
  22. 5,106,4  
 

 

 

Pom.xml 文件如下:

 

[xhtml] view plain
  1. <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"  
  2.   xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">  
  3.   <modelVersion>4.0.0</modelVersion>  
  4.   <groupId>zhzhl_zju</groupId>  
  5.   <artifactId>mahout</artifactId>  
  6.   <version>0.0.1-SNAPSHOT</version>  
  7.   <packaging>jar</packaging>  
  8.   <name>mahout</name>  
  9.   <url>http://maven.apache.org</url>  
  10.   <properties>  
  11.     <project.build.sourceEncoding>UTF-8</project.build.sourceEncoding>  
  12.   </properties>  
  13.   <dependencies>  
  14.     <dependency>  
  15.       <groupId>junit</groupId>  
  16.       <artifactId>junit</artifactId>  
  17.       <version>3.8.1</version>  
  18.       <scope>test</scope>  
  19.     </dependency>  
  20.     <dependency>  
  21.         <groupId>org.apache.mahout</groupId>  
  22.         <artifactId>mahout-core</artifactId>  
  23.         <version>0.4</version>  
  24.         <type>jar</type>  
  25.         <scope>compile</scope>  
  26.     </dependency>  
  27.   </dependencies>  
  28. </project>  
 

原文地址:http://blog.csdn.net/zhzhl202/article/details/6316570

0 0