大数据推荐系统算法之基于内容个性化推荐

来源:互联网 发布:弘扬软件股份有限公司 编辑:程序博客网 时间:2024/05/05 16:53
大数据推荐系统算法有很多种,今天小编和大家分享一下基本内容(Content-based)做个性化推荐的方法。
推荐系统算法之基于内容个性化推荐
基于内容推荐算法的原理很简单,就是通过分析物品的特征,计算新物品与用户历史喜欢物品的相似度,找最接近的topN个作为推荐的候选项。
 
基于内容推荐算法的一般处理步骤以下:
1.将物品的属性资料结构化
2.从物品属性中提取重要特征,可根据实际情况给特征加权。
3.取用户喜欢的历史数据作为训练集,建立出用户的兴趣模型
4.将物品的特征属性与用户兴趣模型计算相似度,用一个阀值来判断用户是否喜欢物品,如果是多个物品时可以按相似度的高到低来取topn作为推荐候选项
 
上面第1、2两个步骤相对简单,就是根据物品实际的特性取重要特征可以了,比如电子产品选品牌,性能相关的特征,衣服鞋之类的可能选材料相关的特征。
 
详细讲解一下第3、4步如果建立用户兴趣模型。举个例子:
item 有三个牲 A,B,C 取用户喜欢的历史数据100条作为训练集。
接下来计算这100条训练样本集中A,B,C三个特征的比例,假如结果是 A:0.45,B:0.25,C:0.3
现在有物品如下
       A    B   C
物品1  0    1   1
物品2  1    0   0
 
那么物品1与用户的兴趣相似度为 0*0.45+1*0.25+1*0.3=0.55
    物品2与用户的兴趣相似度为 1*0.45+0*0.25+0*0.3=0.45
结果很明显物品1更比物品2更适合推荐给用户
本例原代码下载

阅读全文
0 0
原创粉丝点击