pagerank

来源:互联网 发布:家具拆单下料软件 编辑:程序博客网 时间:2024/06/06 07:18

PageRank算法[编辑]
简易版本[编辑]
假设一个由4个网页组成的群体:A,B,C和D。如果所有页面都只链接至A,那么A的PR(PageRank)值将是B,C及D的Pagerank总和。

PR(A)=PR(B)+PR(C)+PR(D)

PR(A)=PR(B)+PR(C)+PR(D)
继续假设B也有链接到C,并且D也有链接到包括A的3个页面。一个页面总共只有一票。所以B给每个页面半票。以同样的逻辑,D投出的票只有三分之一算到了A的PageRank上。

PR(A)=PR(B)2+PR(C)1+PR(D)3

换句话说,根据连出总数平分一个页面的PR值。

PR(A)=PR(B)L(B)+PR(C)L(C)+PR(D)L(D)

最后,所有这些被换算为一个百分比再乘上一个系数 {\displaystyle d} d。由于“没有向外链接的页面”传递出去的PageRank会是0,所以通过数学系统给了每个页面一个最小值
(1d)/N

PR(A)=(PR(B)L(B)+PR(C)L(C)+PR(D)L(D)+)d+1dN

要注意在Sergey Brin和Lawrence Page的1998年原文中给每一个页面设定的最小值是
1d
,而不是这里的
(1d)/N
。 所以一个页面的PageRank是由其他页面的PageRank计算得到。不断的重复计算可以得到所有网页的PageRank。如果给每个网页一个随机PageRank值(非0),那么经过不断的重复计算,这些页面的PR值会趋向于稳定,也就是收敛的状态。这就是搜索引擎使用它的原因。

0 0
原创粉丝点击