对于相同喜好的用户,电商高手用Spark MLlib代码如何操作?

来源:互联网 发布:python tcp 保持连接 编辑:程序博客网 时间:2024/05/17 21:39
日前,小编接触了一个概念——协同过滤。相信很朋友也是第一次听说,上网在某度搜一下,结果发现这个算法居然是很成熟的。


“协同过滤简单来说是利用某兴趣相投、拥有共同经验之群体的喜好来推荐用户感兴趣的信息,个人通过合作的机制给予信息相当程度的回应(如评分)并记录下来以达到过滤的目的进而帮助别人筛选信息,回应不一定局限于特别感兴趣的,特别不感兴趣信息的纪录也相当重要。”


通过学习,小编了解到:在协同过滤中,有两种主流方法:基于用户的协同过滤,和基于物品的协同过滤。


基于用户的 CF 的基本思想相当简单,基于用户对物品的偏好找到相邻邻居用户,然后将邻居用户喜欢的推荐给当前用户。

基于物品的 CF 的原理和基于用户的 CF 类似,只是在计算邻居时采用物品本身,而不是从用户的角度,即基于用户对物品的偏好找到相似的物品,然后根据用户的历史偏好,推荐相似的物品给他。


通过海量数据找到兴趣相同的用户确实是比较容易实现的!但这都是对于老用户而言的。


问题是对于新用户如何通过协同过滤算法解决呢?算法用Spark MLlib代码如何操作呢?


中科院计算所培训中心将于11月6日晚8点,举办《机器学习实战:揭开利用Spark MLlib进行个性推荐的奥秘!》欢迎报名学习!(具体详情请到官网了解)
阅读全文
0 0
原创粉丝点击