Collaborative Knowledge Base Embedding for Recommender Systems（译）

来源：互联网发布：大数据时代的利与弊编辑：程序博客网时间：2024/06/09 14:20

原文地址

http://www.kdd.org/kdd2016/subtopic/view/collaborative-knowledge-base-embedding-for-recommender-systems

该论文发表于16年KDD，主要贡献为在推荐系统中引入了结构信息，文本数据，图像数据等知识库中的信息来提升推荐系统的质量。其中，结构信息采用TransR来得到实体的向量特征，文本数据与图像数据分别使用栈式降噪自编码（Stacked Denoising Auto-encoders, SDAE）与栈式卷积自编码（Stacked Convolutional Auto-encoders）来提取出向量特征。

Item的向量表示是将最初的向量与来自知识库中的三个特征向量相结合。对于构建出的损失函数可以使用随机梯度下降来进行优化，从而实现基于异构数据的ranking推荐。

动机

目前最常用的矩阵分解方法的性能会因为矩阵过于稀疏而性能下降，同时也存在无法推荐新的item和冷启动等问题。基于内容的推荐无法很好的解决推荐结果的多样性问题。考虑到用户对于item的选择也会受到与item相关的其他信息的影响。因此，混合了协同过滤与其他信息的推荐系统通常可以更好地解决这些问题，从而得到更好的结果。

知识库中通常包含了大量的信息，因此有部分工作将知识库作为其他信息来与协同过滤进行融合。然而，这些工作目前存在以下问题：

1、仅仅使用单一的网络结构信息，没有充分利用其他信息。
2、从知识库中提取特征依赖于传统特征工程。为了解决这些问题，本文提出的CKE（Collaborative Knowledge Base Embedding）推荐系统框架。

在讲解CKE网络结构之前，首先介绍相关概念：

1、在user-item矩阵中，数值为1则表示存在相关关系，0则表示不存在。

2、知识库中包含的知识可以分为以下三类。

1）结构知识：通过头尾实体与实体之间的关系组成。

2）文本知识：对于一个实体的一段文字性描述。

3）图片知识：与当前实体有关的图片信息。如电影海报或书的封面。

3、当前需要解决的推荐系统的问题是：给定具有结构知识，文本及图片的知识库和用户的隐式反馈，返回每一个用户最有可能感兴趣的item列表。

知识库与user-item矩阵之间的关系如下图所示。

Illustration of a snippet of user implicit feedback data and knowledge base data

网络结构

总览

The flowchart of the proposed Collaborative Knowledge Base Embedding (CKE) framework for recommender systems

模型主要包含两步。1）针对于知识库中的知识进行向量化表示。2）协同联合训练。在进行知识库的embedding阶段，模型分别针对于结构知识（structural knowledge）,文本知识（textual knowledge），图片知识（visual knowledge）进行向量化表示。embedding的方式分别为Bayesian TransR, Bayesian SDAE, Bayesian SCAE.

在协同联合训练部分，item的向量由从知识库中提取的三个向量与offset vector组成。训练过程通过优化不同item之间的ranking来学习user的隐向量与item的隐向量。