《推荐系统实践》阅读笔记二 利用用户标签进行推荐

来源:互联网 发布:移动签到软件 编辑:程序博客网 时间:2024/05/18 02:23

定义:

根据维基百科的定义②,标签是一种无层次化结构的、用来描述信息的关键词,它可以用来描述物品的语义。


应用:

Delicious, CiteUlike,  Last.fm,   豆瓣,  Hulu


使用方法:

  通常用户喜欢给物品打标签,也喜欢给自己打标签。我们也可以通过标签来记录用户的兴趣和衡量物品的语义,从而将物品和用户联系起来。


标签系统中的推荐问题主要由一下两个:如何利用用户打标签的行为为其推荐物品,如何在用户给物品打标签时为其推荐适合该物品的标签(标签推荐)。

因此我们需要解答:用户为什么要打标签、用户如何打标签、用户打什么样的标签。


因此我们可以通过衡量标签的余弦相似性来衡量物品之间的相似性,同时也可以根据给物品打过标签的用户数来衡量物品的平均热门度。


同时我们可以使用用户打标签的信息和物品被打标签的信息进行推荐, p(u,i) = n(u,b)/log(1+nbu)*n(b,i)/log(1+niu)
对于数据稀疏性,我们可以选取余弦相似性来计算标签之间的相似性。


同时我们也可以对标签数据进行处理和清理:去除词频很高的的停用词、去除词根不同的同义词、去除分隔符的同义词。


推荐的时候我们可以解释用户之前使用过切物品有标签数据,给出了用户对标签的兴趣和标签与物品的相关度,但还可以给考虑 标签与用户的兴趣度、标签和物品的相关度、以及选择哪一种方法进行排序。


在给用户推荐标签的时候,我们可以选择。给用户u推荐整个系统中最热门的标签、物品i上的最热门标签、u经常使用的标签、多种方法融合。




什么样标签:

1 表明物品是什么 比如是一只鸟,就会有“鸟”这个词的标签;是豆瓣的首页,就有一个标签叫“豆瓣”;是乔布斯的首页,就会有个标签叫“乔布斯”。
2 表明物品的种类
3 表明谁拥有物品 比如很多博客的标签中会包括博客的作者等信息。
4 表达用户的观点 比如用户认为网页很有趣,就会打上标签funny(有趣),认为很无聊,就会打上标签boring(无聊)。
5 用户相关的标签 比如 my favorite(我最喜欢的)、my comment(我的评论)等。
6 用户的任务 比如 to read(即将阅读)、job search(找工作)等。

7 类型、时间、任务、地点、语言、奖项、其他。



原创粉丝点击