PageRank 简介

来源:互联网 发布:etl算法 编辑:程序博客网 时间:2024/06/05 22:48

1.简介

google 用 PageRank 来衡量网页的重要程度, 并作为排序的因子之一.
论文见 参考[1].
论文一开始是这么说的:

The importance of a Web page is an inherently subjective matter, which depends on the readers interests, knowledge and attitudes. But there is still much that can be said objectively about the relative importance of Web pages.

2.思想

两个基本思想:
如果网页A被很多网页引用, A的PageRank会变高.
如果网页A被PageRank高的网页引用, A的PageRank会变高.

这里写图片描述
Figure 2-1: Simpli ed PageRank Calculation

这是论文中的图, 描述了文档A的PR(PageRank value) 如何影响它引用的文档B的PR.


图2-2 page u 的计算公式

公式中, Bu 表示引用 page u 的网页集合, L(v) 表示page v 的出站链接个数.

参考

  1. 原始论文, PageRank, 1998