对于相同喜好的用户，电商高手用Spark MLlib代码如何操作？

来源：互联网发布：python tcp 保持连接编辑：程序博客网时间：2024/05/17 21:39

日前，小编接触了一个概念——协同过滤。相信很朋友也是第一次听说，上网在某度搜一下，结果发现这个算法居然是很成熟的。

“协同过滤简单来说是利用某兴趣相投、拥有共同经验之群体的喜好来推荐用户感兴趣的信息，个人通过合作的机制给予信息相当程度的回应（如评分）并记录下来以达到过滤的目的进而帮助别人筛选信息，回应不一定局限于特别感兴趣的，特别不感兴趣信息的纪录也相当重要。”

通过学习，小编了解到：在协同过滤中，有两种主流方法：基于用户的协同过滤，和基于物品的协同过滤。

基于用户的 CF 的基本思想相当简单，基于用户对物品的偏好找到相邻邻居用户，然后将邻居用户喜欢的推荐给当前用户。

基于物品的 CF 的原理和基于用户的 CF 类似，只是在计算邻居时采用物品本身，而不是从用户的角度，即基于用户对物品的偏好找到相似的物品，然后根据用户的历史偏好，推荐相似的物品给他。

通过海量数据找到兴趣相同的用户确实是比较容易实现的！但这都是对于老用户而言的。

问题是对于新用户如何通过协同过滤算法解决呢？算法用Spark MLlib代码如何操作呢？

中科院计算所培训中心将于11月6日晚8点，举办《机器学习实战：揭开利用Spark MLlib进行个性推荐的奥秘！》欢迎报名学习！（具体详情请到官网了解）

阅读全文

0 0