基于sparkMLlib的机器学习_[2]_基本算法[1]协同过滤算法
来源:互联网 发布:js 获取滚动条位置 编辑:程序博客网 时间:2024/05/17 08:13
协同过滤算法
1-1基本概述
基于用户或物品的推荐算法,人以群分,物以类聚
(1) 基于用户,“人以群分”
孩童A和孩童B是“志同道合”的基友(相似度很高),将A喜欢的物品推荐给B是合理的
(2)基于物品,“物以类聚”
在无先验知识的前提下,根据孩童A所喜欢物品的相似性,将相似物品推荐给A,是合理的
(3)问题
基于用户,数据量大,对于通用物品往往优先推荐,对于热点物品不够准
基于物品,数据量相对小,而推荐同类物品存在用户已持有不再需要的问题
1-2相似度度量原理(如何判断是“基友”)
参考资料:
- 距离和相似性度量
- Machine Learning: Measuring Similarity and Distance
- What is Mahalanobis distance?
- Cosine similarity, Pearson correlation, and OLS coefficients
- 机器学习中的相似性度量
- 动态时间归整 | DTW | Dynamic Time Warping
- 漫谈:机器学习中距离和相似性度量方法
1-3算法学习
协同过滤之ALS-WR算法
阿基米德项目ALS矩阵分解算法应用案例
Databricks孟祥瑞:ALS 在 Spark MLlib 中的实现
http://www.cnblogs.com/ShaneZhang/p/3938026.html
http://www.fuqingchuan.com/2015/07/596.html
1-4实践
(1)spark summit2014中的电影推荐实践示例
Movie Recommendation with MLlib
0 0
- 基于sparkMLlib的机器学习_[2]_基本算法[1]协同过滤算法
- 基于sparkMLlib的机器学习_[1]_基本数据类型[2]向量标签LabeledPoint
- 基于sparkMLlib的机器学习_[1]_基本数据类型[1]本地向量
- 基于sparkMLlib的机器学习_[1]_基本数据类型[3]本地矩阵Local Matrix
- 基于sparkMLlib的机器学习_[1]_基本数据类型[4]分布式矩阵DistrubutedMatrix
- 机器学习,协同过滤算法
- Spark机器学习之协同过滤算法
- 机器学习常用算法三:协同过滤
- 简单易学的机器学习算法——协同过滤推荐算法(2)
- 简单易学的机器学习算法——协同过滤推荐算法(1)
- 基于协同过滤算法的推荐系统
- 基于协同过滤算法推荐的过程
- 基于用户的协同过滤算法
- 基于用户的协同过滤算法
- 基于用户的协同过滤算法
- 基于物品的协同过滤算法
- 基于用户的协同过滤推荐算法
- 基于皮尔森相关系数的协同过滤算法
- 我的第一个python爬虫脚本
- java,相差天数
- golang recover from panic situation: - reflect: call of reflect.Value.Elem on struct Value
- 计算机思维--0和1与逻辑
- 打安卓包,更换包名 的 三个 关键点
- 基于sparkMLlib的机器学习_[2]_基本算法[1]协同过滤算法
- 虚拟机Ubuntu14.04用respin制作LiveCD及ISO镜像
- 读linux驱动程序开发笔记
- 虚拟机CentOS-6.5下的安装Oracle11g R2
- linux中的regulator
- jQuery 取值、赋值的基本方法整理
- Radiobutton
- 2016年最新苹果开发者账号注册流程详解(公司账号篇)
- centos不能联网设置BOOTPROTO