推荐系统中的同现矩阵问题

来源:互联网 发布:阅知什么意思 编辑:程序博客网 时间:2024/06/05 13:31

最近在研究Hadoop大数据方面的知识,正巧看到了推荐系统,其中里面有个同现矩阵很是让我蒙圈,查了很多blog之后,写下来与大家分享。


1.建立同现矩阵的过程

在协同过滤算法中同现矩阵的建立是极其关键的一部,原始数据如下:

1,101,5.01,102,3.01,103,2.52,101,2.02,102,2.52,103,5.02,104,2.03,101,2.03,104,4.03,105,4.53,107,5.04,101,5.04,103,3.04,104,4.54,106,4.05,101,4.05,102,3.05,103,2.05,104,4.05,105,3.55,106,4.0

第一个数字是用户ID,第二个数字是电影ID,最后一个数字是用户对该影片的打分结果。

首先看到用户1,观看了101,102,103。则按照同现矩阵的思想,对

(101,101)、(101,102)、(101,103)

(102,101)、(102,102)、(102,102)

(103,101)、(103,102)、(103,103)点位加一,表示用户1对101,102,103影片的关联程度加一,同理将其余4个用户对影片的关联程度都相加,得到同现矩阵如下:



2.建立用户评分矩阵

用户评分矩阵即为用户i对产品打分的矩阵表示,以用户3为例:

      U3[101] 2.0[102] 0.0[103] 0.0[104] 4.0[105] 4.5[106] 0.0

3.计算推荐得分

同现矩阵*用户评分矩阵=推荐分矩阵
由于同现矩阵的意思就是商品之间的关联程度,由于我们已经知道用户评分矩阵,所以即便用户对某一商品没有使用或者打分
但是根据其他相关联产品我们也可以得出一个推荐系统。

1 0
原创粉丝点击