因式分解结合最近邻：多层面的协同过滤模型

来源：互联网发布：外卖快餐软件编辑：程序博客网时间：2024/06/05 15:35

摘要

推荐系统为用户提供个性化的产品和服务。这些系统大部分都使用协同过滤，通过分析过去行为以建立用户和产品之间的联系。CF的2个比较成功的方法，其一是隐语义模型LFM，它直接描述用户和产品；另一是近邻模型，它分析用户或产品之间的相似度。在本文中，为这两种方法引入一些创新。因子模型和近邻模型可以顺利的融合，因此可以得到一个更准确的组合模型。通过扩展模型以利用用户的显式和隐式反馈来实现进一步的精度改进。本方法已经在netflix数据上测试过，比之前发表过的结果都好。另外，我们建议一个新的评估指标，其中突出了方法之间的差异，基于他们在top k推荐任务中的表现。

引言

现在的消费者面对的是过多的选择，电商和内容供应商提供巨大的产品选择，具有前所未有的机会，以满足各种特殊需求和口味。用最合适的产品匹配消费者并不是微不足道的，它是提升用户满意度和忠诚度的关键。这强调了推荐系统的突出地位，它为适合用户口味的产品提供个性化推荐。
推荐系统通常是基于cf的，它根据用户过去的行为比如建模，不需要显示配置。显然，CF技术不需要专业领域知识，并且避免了大量数据采集。直接依赖用户行为可以发现复杂和意想不到的模式，然而使用已知的数据属性进行配置是困难或不可能的。因此，CF在过去十年中引起了极大的关注，导致了一些成功的商业系统，包括Amazon [15]，TiVo和Netflix，取得了显着的进步。
为了建立推荐系统，CF系统需要比较根本不同的对象：用户和物品。有两个主要方法来促进这种比较，这构成了CF的两个主要方法：近邻模型和因子模型。
近邻模型主要是计算用户或者物品之间的关系。面向物品的方法根据相同用户对相似物品的评级来评估用户对物品的偏好。从某种意义上说，这些方法通过将用户作为物品评级的篮子将用户转换为物品空间。这样，我们不再需要将用户与物品进行比较，而是直接将物品与物品相关联。
因子分析模型，例如奇异值分解（SVD），包括通过将物品和用户转换为相同潜在因素空间的替代方法，从而使它们直接可比。潜在空间试图通过对用户反馈自动推断的因素对产品和用户进行表征来解释评级。例如，当产品是电影时，因素可能会衡量明显的维度，如喜剧与戏剧，动作量或儿童的方向; 不太明确的定义，如人物发展的深度或“奇怪”，或完全不可解释的维度。

参考文献

http://blog.csdn.net/harryhuang1990/article/details/9924377

0 0