不依赖链接的新搜索方法

来源:互联网 发布:派派软件怎么样 编辑:程序博客网 时间:2024/05/18 03:35

转自http://www.solidot.org

《MIT技术评论》报导(中文版),Google著名的PageRank算法是基于页面的超链接,普林斯顿大学研究人员开发出一种不依靠超链接,去评估和衡量页面与文件重要性的方法。 普林斯顿大学开发的软件,能根据文件的存档,衡量文件中的用词随时间的微妙变化。软件通过分析文件中的文本,识别出特定类别中最重要的词与短语——这些词语会出现在不同文档中。然后分辨出最早出现的用词,确定影响其它文件的原始文档。研究人员在三个包含上千篇期刊文章的大型文献集上测试了新算法。他们发现,被软件识别为具有影响力的文章,也是被大量引用的文章。领导这项研究的David Blei认为,这种方法是根据原创思想识别影响力。它可能会促进更好的实时搜索引擎和推荐系统。