程序博客网 > windows7优化开机速度

使用SVD++进行协同过滤（算法原理部分主要引用自他人）

来源：互联网发布：windows7优化开机速度编辑：程序博客网时间：2024/04/30 16:53

参考:http://www.cnblogs.com/Xnice/p/4522671.html

SVD++是基于SVD(Singular Value Decomposition)的一种改进算法。SVD是一种常用的矩阵分解技术，是一种有效的代数特征提取方法。SVD在协同过滤中的主要思路是根据已有的评分情况，分析出评分者对各个因子的喜好程度以及电影包含各个因子的程度，最后再反过来分析数据得出预测结果。

其在协同过滤中的具体应用方法是先对user_movie的rating矩阵的缺失值用随机数据予以填充，然后将预处理之后的矩阵作为SVD算法的输入，进行迭代求解。

为了更好的说明SVD算法，需要首先对matrix factorization model和Baseline Predictors进行简单的介绍。

matrix factorization model:

图表 1评分矩阵形式（引用）

评分矩阵U（形式如上图）可被分解为两个矩阵相乘

将这种分解方式体现协同过滤中，即有：

(matrix factorization model )

在这样的分解模型中,Pu代表用户隐因子矩阵（表示用户u对因子k的喜好程度),Qi表示电影隐因子矩阵（表示电影i在因子k上的程度）。

Baseline Predictors:

Baseline Predictors使用向量bi表示电影i的评分相对于平均评分的偏差，向量bu表示用户u做出的评分相对于平均评分的偏差，将平均评分记做μ。

(Baseline Predictors)

SVD:

SVD就是一种加入Baseline Predictors优化的matrix factorization model。

SVD公式如下：

加入防止过拟合的 λ 参数，可以得到下面的优化函数：

对上述公式求导，我们可以得到最终的求解函数:

SVD++:

SVD算法是指在SVD的基础上引入隐式反馈，使用用户的历史浏览数据、用户历史评分数据、电影的历史浏览数据、电影的历史评分数据等作为新的参数。

求解公式如下：

使用用户的历史评价数据作为隐式反馈，算法流程图如下：

【Reference】

【1】从item-base到svd再到rbm，多种Collaborative Filtering(协同过滤算法)从原理到实现http://blog.csdn.net/dark_scope/article/details/17228643

0 0

windows7优化开机速度

windows7优化开机速度

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子康奈尔大学建筑学专业康奈尔大学在哪个州康奈尔大学环境工程康奈尔电阻丝康奈尔大学分数线康奈尔大学约翰逊商学院康奈尔笔记模板康奈尔大学化学康奈尔在哪个州美国哥伦比亚大学世界排名美国哥伦比亚大学美国哥伦比亚美国哥伦比亚大学排名哥伦比亚大学世界排名康奈皮鞋质量怎样康奈特康耐特股票康妇凝胶用后有脏东西康妇灵康妇炎康婴健康婴健平安膏康婴健洗发水怎么样康婴健这个牌子怎么样咪呢小熊康子妮护视康纳米增视老花镜康宁玻璃碗康宁终身重疾保险康宁杰瑞生物科技有限公司国寿康宁定期保险康宁保险重大疾病好吗康宁定期重大疾病险美国康宁玻璃锅的缺点康宁晶彩锅康宁锅怎么样康宁锅可以用电磁炉吗康宁玻璃锅的使用禁忌康宁锅菜谱康宁锅缺点康宁锅具