基于机器学习的移动应用推荐系统的研究与实现

来源:互联网 发布:黄金交易软件 编辑:程序博客网 时间:2024/06/08 14:21

基于机器学习的移动应用推荐系统的研究与实现

长尾现象(long tail)

大量的冷门的APP被热门的APP所覆盖,无法被用户找到。APP的关联系统希望能够在用户浏览当前APP的同时,为用户推荐与该APP相关的其他的冷门但是又满足用户需求的APP。比如当前的微信小程序,轻便快捷,就满足推荐的需求。

推荐方法

在语义层面来衡量APP之间的相似性。每个APP都会有一个APP的介绍,也就是描述文档。一般认为,这个描述文档会包含该APP的功能介绍,功能相似的APP可以一起被推荐给有该功能需求的用户,供用户挑选使用。
可以采用的功能分析的方法有pLSA,LDA,doc2vec等自然语言处理中的方法。实际上,这些方法是用来提取文本中最具有特征代表性的词汇。
学习排序 (learning to rank)

推荐系统

有多种推荐方法,我们主要是用基于内容的推荐(content-based)还有协同过滤推荐系统。

1.基于内容的推荐

根据功能相似来推荐APP,在这一步就需要将功能相似的APP聚集在一起。推荐与用户查询功能最接近的APP。

(1)如何计算功能相似度

APP的功能含在APP的描述文本中。那么,为了更好的获得APP的详细功能,我们就需要对描述文本进行更好的特征提取。一般的特征提取就是LDA主题模型,获得该文本的主题特征,用这些特征来表示该APP的功能。对于每一个描述文本都有一个向量来表示,那么可以根据这些向量来计算每一个APP之间的相似度。最关键的还是有效特征的提取

(2)关键词提取

文章:Automatic keyword extraction from individual documents
代码:https://github.com/aneesha/RAKE
1.停用词被认为是无信息或者无意义的。因此需要首先去除。
2.关键词评分 关键词的TFIDF会比较高。所最简单的抽取关键词的方法就是TFIDF。还有LDA等,用找出的表示主题的词来作为该文本的关键词。
3.但是因为APP的文本本来就比较少,那么就会导致关键词的提取不够准确。

阅读全文
1 0
原创粉丝点击