基于sparkMLlib的机器学习_[2]_基本算法[1]协同过滤算法

来源:互联网 发布:js 获取滚动条位置 编辑:程序博客网 时间:2024/05/17 08:13

协同过滤算法

1-1基本概述

基于用户或物品的推荐算法,人以群分,物以类聚

(1)  基于用户,“人以群分”

孩童A和孩童B是“志同道合”的基友(相似度很高),将A喜欢的物品推荐给B是合理的

(2)基于物品,“物以类聚”

在无先验知识的前提下,根据孩童A所喜欢物品的相似性,将相似物品推荐给A,是合理的


(3)问题

基于用户,数据量大,对于通用物品往往优先推荐,对于热点物品不够准

基于物品,数据量相对小,而推荐同类物品存在用户已持有不再需要的问题


1-2相似度度量原理(如何判断是“基友”)

参考资料:

    1. 距离和相似性度量
    2. Machine Learning: Measuring Similarity and Distance
    3. What is Mahalanobis distance?
    4. Cosine similarity, Pearson correlation, and OLS coefficients
    5. 机器学习中的相似性度量
    6. 动态时间归整 | DTW | Dynamic Time Warping
    7. 漫谈:机器学习中距离和相似性度量方法

1-3算法学习

协同过滤之ALS-WR算法

阿基米德项目ALS矩阵分解算法应用案例

Databricks孟祥瑞:ALS 在 Spark MLlib 中的实现

http://www.cnblogs.com/ShaneZhang/p/3938026.html

http://www.fuqingchuan.com/2015/07/596.html

1-4实践

(1)spark summit2014中的电影推荐实践示例
Movie Recommendation with MLlib




0 0
原创粉丝点击