数据挖掘算法手记

来源:互联网 发布:喵喵机 知乎 编辑:程序博客网 时间:2024/06/06 01:29

1)item base

a)每个用户所关注的所有书,根据对每一本书行为打分(订阅、浏览、点击等行为加权总分),选出分值最高的5本书(即先定位用户最关注的5本书)

b)每一本书计算最相近的3本书作为推荐,最终给每个用户推荐5*3 本书

c)item1。。。。。itemtn

d)根据item1,如何确定推荐哪3本?

e)item1 和 item2 算相关性(将同时看过item1和item2的用户打分相乘,然后将所有user的分值相加,计算总分),然后item1再和itemn计算总分,最终分值排名取前3即

f)解决长尾,解决新用户


2)user base

a) 圈子的社会化行为,马太效应

b) 适合引入新item,可以很快扩散,解决new item冷启动问题


3)content base


0 0