《一种文献推荐的因子图方法》笔记

来源：互联网发布：win10安装ubuntu共存编辑：程序博客网时间：2024/05/29 16:22

1、内容过滤法是根据文献内容与用户兴趣的相似性来进行文献推荐，协同过滤法则是先找到与用户兴趣最相似的用户，然后根据最相似用户感兴趣的文献向当前用户推荐文献。

2、本文的目标：在缺少用户描述的情况下，向用户有效地推荐若干个主题下的高相关度文献，即不考虑用户兴趣，随机选择主题进行推荐。

3、采用ACT模型，对引文网络进行处理，获得引文网络中的主题数目，在建模时生成一定数目的主题，以及引文网络中每篇文献所属各个主题的概率分布。

3、本文的输入为原始数据引文网络，通过ACT模型处理得到抽象数据主题数以及各个文献的主题概率分布，输出值为引文网络中文献与主题之间的相关度概率分布以及某个主题下最大可能出现的主题相关度组合（维度|v|）。

4、通过对ACT模型处理后的数据建立因子图模型：变量节点为观察变量集合V，隐含变量（文献与主题相关度）集合Y，以及节点特征函数g和边特征函数f。

5、建立的节点特征函数中只包含未知变量Y，同理，边特征函数中也只包含边所连接的两个隐含节点的y。

6、将因子图看成马尔可夫网络，同时将因子图中极大团上的势函数定义为该极大团上节点特征函数和边特征函数的乘积，则该网络的联合概率分布为图中所有极大团上势函数的乘积，分解成所有节点特征函数的乘积和边特征函数的乘积，再乘以归一化常数。

7、采用循环最大和算法推断网络上的联合概率，采用串行消息调度机制保证算法的收敛，得到max-sum算法中的消息：

8、通过对两类消息的推导得到所有隐含节点的边缘概率，同时网络上的联合概率为极大团上势函数的乘积，因而假定某个节点为根节点，则对该节点所在极大团上势函数求最大值则可获得该节点的值，再依次从根节点向叶节点求最大值，推导出联合概率最大时所有叶节点的值。即得到所求的联合概率最大时所有节点的值。

9、从得到的值中选取隐含节点为1的观察变量，再通过对隐含节点的边缘概率值排序，得到前n个推荐文献。

9、关键需要获得ACT模型建立过程以及在网络很大的情况下因子图动态规划计算的方法。

10、本论文只关注因子图上的概率推导过程，对具体的计算以及初始数据的处理均采用已有的工具，相当于只做了推荐的中间概率计算过程。

建立的因子图模型：

1、组成部分：

a、观察变量集合V，每个v即一个文献。

b、隐含变量集合Y，每个y表示文献和主题是否相关，为1表示相关，0表示不相关。

c、特征函数，分为节点函数和边特征函数。节点特征函数的是从节点到隐含变量的映射关系，或者说影响因素，本文的影响因素主要考虑文献的主题概率分布和被引用次数。

阅读全文

0 0