异构信息网络+推荐===总结

来源:互联网 发布:ps4串流pc软件 编辑:程序博客网 时间:2024/05/16 11:20

关于异构信息网络的基本概念,可以先看看:异构信息网络–基本概念和定义学习笔记

**

一、元路径(Meta Path)

**

- 因为异构信息网络(以后简称为HIN)中包含着更多的节点类型和边的类型,相对于同构网络来说比较复杂,所以Yizhou Sun【1】第一次提出了元路径(meta path)的概念,基于元路径来分析HIN,简单来说元路径就是连接两个节点之间的边类型和节点类型的串联。详细的还是看异构信息网络–基本概念和定义学习笔记。

- 基于元路径最基本的两个工作是:
(1)衡量HIN中基于对称元路径的相同类型节点间的相似度方法PathSim【1】(代码python2.7:http://download.csdn.net/download/u013527419/9475257)。
(2)衡量HIN中基于任意元路径的相同/不同类型节点间的相似度方法HeteSim【2】(代码没共享,有需要的可以问我要)。
当然还有其他的很多:PathCount(像这种偏好于可见度高的节点的方法是不是更应该应用到推荐的任务中呢?直觉上人也是更选择流行度高的items),PCRW等。后来基于这两种基本的方法又有了很多工作,毕竟相似度是一些像是聚类、链接预测、推荐等工作的基础。这方面感兴趣的可以参考一下北京邮电大学Chuan Shi老师的publications:http://dblp.uni-trier.de/pers/hd/s/Shi:Chuan。
(3)其他基于meta path 的相似度度量方式:
- common node,PCRW,BPCRW
- KnowSim(based on given meta path and the reverse meta path)
- AvgSim(similarity of documents in HIN)
- RelSim(measure the similarity of relations in HIN)

3.HIN中基于meta path做推荐的工作,比较经典的就是:
(1)SemRec【3】在加权HIN中综合考虑基于不同meta poth 的user和item之间的相似度来做推荐;
(2) Yu et al. 【4】用了矩阵分解的方法得到基于不同meta poth 的user和item的隐式特征来做推荐;

这两种方法都是基于不同的meta path得到不同的结果,所以这里有一个数据融合的问题,【3】用HeteSim?得到基于不同meta path 的user和item之间的相似度,然后将这些相似度用不同权重合起来,这种方法并没有考虑 implict factors,并且得到的不同的用来做ensemble的相似度矩阵都可能很稀疏。 【4】是先矩阵分解得到基于不同meta poth的user和item的隐向量表示之后,再用通过给内积分配不同的权重来拟合真实的评分,来得到权重值。这种方法在最终做做ensemble的的过程中其实只是考虑到了与当前预测值有关的variables,跟其他值是没有关系的。
这方面可以看看Yizhou Sun 的相关文章:http://www.ccs.neu.edu/home/yzsun/Publications.htm
或者是 Xiang Ren :http://xren7.web.engr.illinois.edu/,X. Yu等。
**

二、Meta Structure 或 Meta Graph

**
这里写图片描述
这里写图片描述

1. 鉴于meta path的表征能力有限。例如,在DBLP中, 如果我们想要度量发表的论文既在同一个会议上又含有相同的主题词(i.e.,the APVPA and APTPA paths)的两个作者的关系时,meta path 就不太好使,像是a1 和a2 基于meta path的三种相似度都是相同的。【5】提出了meta structure,,能表示一些更复杂的关系,meta path 是 meta structure 的特例。
2. 基于 meta structure 做推荐的可以看看【6】。
这方面感兴趣的可以看一下:https://www.cse.ust.hk/~yqsong/ 和 http://i.cs.hku.hk/~ckcheng/

参考文献:
【1】Sun, Y.Z., Han, J.W., Yan, X.F., Yu, P.S., Wu, T.: PathSim: meta path-based Top-K similarity
search in heterogeneous information networks. In: VLDB, pp. 992–1003 (2011)
【2】Shi, C., Kong, X., Huang, Y., Philip, S.Y., Wu, B.: Hetesim: a general framework for relevance
measure in heterogeneous networks. IEEE Trans. Knowl. Data Eng. 26(10), 2479–2492 (2014)
【3】Shi, C., Zhang, Z., Luo, P., Yu, P.S., Yue, Y., Wu, B.: Semantic path based personalized
recommendation on weighted heterogeneous information networks. In: CIKM, pp. 453–462
(2015)
【4】Yu, X., Ren, X., Sun, Y., Gu, Q., Sturt, B., Khandelwal, U., Norick, B., Han, J.: Personalized
entity recommendation: a heterogeneous information network approach. In: WSDM, pp. 283–
292 (2014)
【5】Huang, Z., Zheng, Y., Cheng, R., Sun, Y., Mamoulis, N., Li, X.: Meta structure: computing
relevance in large heterogeneous information networks. In: SIGKDD, pp. 1595–1604 (2016)
【6】Meta-Graph Based Recommendation Fusion over Heterogeneous Information Networks.

感觉上面那些人都是一个大圈里的,最后挂的人无非就是Yizhou Sun,Philip S. Yu,Jiawei Han。
补充:关于推荐系统的一些乱七八糟的总结,可以看看:http://write.blog.csdn.net/postlist/6424393/null

原创粉丝点击