PageRank算法

来源:互联网 发布:3d室内设计软件 编辑:程序博客网 时间:2024/04/30 04:04
PageRank的核心思想是马尔科夫链的内容:
一个定理:
定理:不可约遍历的马尔科夫链有唯一的平稳分布
定理证明如下:
PageRank算法

PageRank算法

PageRank算法

PageRank算法
其中提到的定理四推论2如下:
PageRank算法
其中关于n步转移概率矩阵的行之和为1的证明如下:
PageRank算法

PageRank算法

以上是理论知识,下面关于PageRank本身:
1、pagerank通常有一个初始的状态分布如[pi1(0),pi2(0),pi3(0).......]其中pi1(0)表示初始时刻(0时刻)状态1的概率。该向量之和为1.
2、PageRank有一个转移概率矩阵p,该矩阵符合不可约遍历马尔科夫链中关于Pij(从状态i转移到状态j的概率)的要求,(通常在pagerank的处理过程中都是为了使转移概率矩阵满足要求,例如1-a,a等)。
3、依据上面的定理当转移步数(或者迭代步数)n趋向于无穷时,limn∽∞(pij**n)存在极限值лj表示n步转移后处在状态j的概率),于是n步转移矩阵的每一列都是p(i=1,2,3....,j)=лj即第j列每个元素都是лj。
4、根据计算pi(0)*p**n = л(pi一行成一p的一列,因为pi和为一而p的列数值全相同,所以值为лj,依次乘第二列、第三列。。。。。。最后得到л。)
л即最终的稳态分布

关于什么是不可约以及什么是遍历,定义如下:
PageRank算法

PageRank算法

PageRank算法

PageRank算法


0 0
原创粉丝点击