PageRank算法简述

来源:互联网 发布:51单片机控制舵机 编辑:程序博客网 时间:2024/06/15 10:05

PageRank算法使得Google搜索引擎的搜索结果相比起应用该算法之前有了质的提升。互联网中的网页非常多,那么如何确定网站的可信度是搜索引擎必须要先处理的问题。而PageRank算法则用了一个比较科学的方法处理这个问题:即一个网页被越多其它网页链接,他受到的普遍承认和信赖也就越高。当然,如果单单是这样还是比较不合理的,对于一些本身信赖度就比较高的网页,应该分配给这些网页比较高的权重。


可是这样子又会引出一个问题,要确定某个网页的可信度必须先确定引用了这些网页的可信度。这样循环下去,会让这个问题陷入一个奇怪的循环。而布林把这个问题成功解决了。他结合二维矩阵并加入迭代的思想。一开始假定所有网页的可信度是相同的,即赋予相同的初始值,然后根据这个条件算出各个网页的可信度。然后根据第一次计算得到的结果算出第二次迭代的结果,这样迭代几次之后,计算得到的值就会收敛于真实值。但是,互联网上的网页数量过于巨大,基于这个问题佩奇和布林又使用了稀疏矩阵的技巧大大简化了计算量。

0 0
原创粉丝点击