推荐系统常用算法

来源:互联网 发布:天军软件下载 编辑:程序博客网 时间:2024/05/17 03:01

这里写图片描述1.基于内容的推荐:
它是建立在项目的内容信息上做出推荐的,而不需要依据用户对项目的评价意见,更多的需要用机器学习的方法从关于内容的特征描述的实例中得到用户评鉴对象的特征,学习用户的兴趣,考虑用户资料与待评测项目的相匹配程度,用户的资料模型取决于所用学习方法,常用的有决策树,神经网络和基于向量的表示方法等。基于内容的用户资料是需要用户的历史数据,用户资料模型可能随着用户的偏好改变而改变。
优点:
不需要其他用户的数据,没有冷开始问题和稀疏问题。
能为具有特殊兴趣的用户进行推荐。
通过列出推荐项目的内容特征,可以解释为什么推荐那写项目。
已有比较好的技术,如关于分类学习方面的技术已经相当成熟。
缺点:要求内容抽取成有意义的特征,要求特征内容有良好的结构性,并且用户的口味必须能能够用特征形式来表达,不能显式地得到其他用户的判断情况。
2.协同过滤
他一般采用最临近技术,利用用户的历史爱好信息计算用户信息计算用户之间的距离,然后利用目标用户的最临近用户对商品评价的加权价值来预测目标用户对特定商品的喜好程度,系统从而根据这一喜好程度来对目标用户 进行推荐。
协同过滤分为:
基于用户的协同过滤
基于物品的协同过滤

基于用户的协同过滤
1.如果用户i对项目j没有评分过,就找到与用户i最相似的k个临近(采用pearson相关系数)
2.然后用这k个邻居对项目j的评分的加权平均来预测用户i对项目j的评分。

基于物品的协同过滤
1.如果用户i对项目j没有评分过,就把Rij设为0,找到与物品j最相似的k个临近(采用余衒距离)
2.然后用这k个邻居对项目j的评分的加权平均来预测用户i对项目j 的评分。

slopeOne算法

knn linear interpolation item_based推荐算法

SVD推荐算法

Tree Cluster—based推荐算法

mahout推荐算法介绍

从数据处理能力上可以划分为:
单机内存算法实现
基于hadoop的分布式算法实现

算法评判标准:召回率(recall)和查准率(precision)

都是越大越好

0 0
原创粉丝点击