Mahout0.9—Hadoop2.20—协同过滤算法
来源:互联网 发布:外星人跑分用什么软件 编辑:程序博客网 时间:2024/06/05 06:16
1. Mahout0.9—Hadoop2.20—协同过滤算法
1.1. 基于物品的协同过滤推荐函数
Mahout支持推荐函数,通过mahout –-help 查看:
itemsimilarity是计算物品相似度矩阵;如果只需要相似矩阵,可用此函数。
函数2:recommenditembased: : Compute recommendations using item-based collaborative filtering
recommenditembased是计算物品相似度矩阵,并根据相似矩阵和用户数据进行推荐结果计算;recommenditembased的计算过程包括itemsimilarity;
1) itemsimilarity参数
通过mahout itemsimilarity –-help 查看:
--input (-i) input, 设置数据输入路径
--output (-o) output ,设置结果输出路径
--similarityClassname (-s) ,设置相似度计算函数:
SIMILARITY_COOCCURRENCE,同现相似度
SIMILARITY_LOGLIKELIHOOD, 对数似然相似度
SIMILARITY_TANIMOTO_COEFFICIENT
SIMILARITY_CITY_BLOCK, 曼哈顿距离相似度
SIMILARITY_COSINE, 余弦相似度
SIMILARITY_PEARSON_CORRELATION,皮尔森相似度
SIMILARITY_EUCLIDEAN_DISTANCE, 欧氏距离相似度
具体函数定义参照:http://blog.fens.me/mahout-recommend-engine/
--maxSimilaritiesPerItem (-m), 物品最大相似物品数量,默认是100;
--maxPrefs (-mppu) ,最大评分,默认是: 500
--minPrefsPerUser (-mp) ,最小评分,默认是1
--booleanData , false评分 true 0、1
--threshold (-tr) ,相似度过滤
--randomSeed ,抽样
--tempDir tempDir ,临时目录
2) recommenditembased参数
通过mahout recommenditembased–-help 查看:
--input (-i) input, 设置数据输入路径
--output (-o) output ,设置结果输出路径
--similarityClassname (-s) ,设置相似度计算函数
--numRecommendations (-n) ,每个用户推荐数量,默认10
--usersFile,计算用户推荐结果的用户数据
-- itemsFile,推荐结果只包含该物品列表;
--maxSimilaritiesPerItem (-m), 物品最大相似物品数量,默认是100;
--maxPrefs (-mppu) ,最大评分,默认是: 500
--minPrefsPerUser (-mp) ,最小评分,默认是1
--booleanData , false评分 true 0、1
--threshold (-tr) ,相似度过滤
--filterFile (-f) ,过滤用户推荐物品
--randomSeed ,抽样
--tempDir tempDir ,临时目录
1.2. 基于物品的协同过滤推荐
#上传数据sudo hadoop fs -put ./item.txt /testdata/ input
sudo hadoop fs -put ./user.txt /testdata/ output
sudo mahout itemsimilarity -i /testdata/ input /item.txt -o /testdata/ output -s SIMILARITY_COOCCURRENCE --tempDir /testdata/temp
sudo mahout recommenditembased -i /testdata/ input /item.txt -o /testdata/ output --usersFile /testdata/userfile/user.txt -s SIMILARITY_COOCCURRENCE -n 20 --tempDir /testdata/temp
转载请注明出处:
http://blog.csdn.net/sunbow0/article/details/41962125 0 0
- Mahout0.9—Hadoop2.20—协同过滤算法
- Mahout0.9—Hadoop2.20—FPG关联规则算法
- 推荐算法—协同过滤
- Mahout0.9 ——hadoop2.2.0编译与安装
- 协同过滤算法——入门
- hadoop2.2+mahout0.9实战
- hadoop2.2+mahout0.9实战
- hadoop2.2+mahout0.9问题
- Mahout0.9安装(Hadoop2.6.0)
- mahout0.9 hadoop2.x 编译
- 推荐算法——基于用户的协同过滤算法
- 推荐算法——基于物品的协同过滤算法
- 协同过滤——基于用户的推荐算法
- 推荐系统学习(二)——协同过滤算法
- Spark—基于物品的协同过滤推荐算法
- 协同过滤算法
- 协同过滤推荐算法
- 协同过滤推荐算法
- mybatis实战教程(mybatis in action)之六:与Spring MVC 的集成
- python代码`if not x:` 和`if x is not None:`和`if not x is None:`使用
- 如何防止别人下载你wordpress网站主题的中文语言包
- 简单编程(十九)定义一个数组来存储12个学生的成绩。统计各成绩等级
- Web_PHP_DedeCMS_评论管理_点赞功能闲谈;
- Mahout0.9—Hadoop2.20—协同过滤算法
- 清除访问局域网密码缓存( samba )
- 双拼top域名释义能力强、使用范围广
- Android Overlay机制简述
- mybatis实战教程(mybatis in action)之七:实现mybatis分页(源码下载)
- [Android实例] android 获得一个应用程序的启动次数,运行时间等信息
- 人生是一场相逢,人生又是一场遗忘
- Mahout0.9—Hadoop2.20—FPG关联规则算法
- ListView详解