探秘Google新搜索引擎算法

来源:互联网 发布:淘宝网窗帘罗马圈 编辑:程序博客网 时间:2024/04/28 19:19

探秘Google新搜索引擎算法Hummingbird的16个疑惑

 

Google搜索作为互联网最主要的搜索引擎,承担着用户复杂的搜索指令。北京时间9月27日,Google发布了其搜索算法的重大更新,代号为“Hummingbird”(蜂鸟),Google表示本次算法改进是基于页面排名与指数的重新思考,这也是自2010年来Google搜索算法的主要升级。

随着搜索查询变得更加复杂,传统的Boolean算法(一种基于关键字的搜索算法)开始恶化,因为现在搜索结果不仅要与字词匹配,还要与概念和意义相匹配。而Hummingbird算法正是Google为了解决这一问题而做出的努力。该算法更新其实早在一个月之前就已经悄悄推广到了Google全球近90%的搜索中,采用新算法后,搜索可以更好地处理更长的、更复杂的问题。

原文作者Danny Sullivan是Search Engine Land网站的创始人;自1996年以来,Danny便从事搜索引擎和搜索市场方面的研究。本文是他根据Google在发布会上分享的一些内容,随后又对Google搜索的两位高管Amit        Singhal和Ben Gomes进行了采访,整理出此文,希望借助这些常见的问题能够为大家解答关于Hummingbird算法方面的疑惑。(以下为译文)

1. 什么是“搜索算法”?

这是一种技术术语,是Google为了给每一次搜索请求从数十亿网页和信息进行排序,以获取最佳答案。简单来说,搜索引擎算法就是搜索网络中的资源,然后在服务器中建立索引,供快速查询的算法!

2. 什么是“Hummingbird”?

这是Google近日推出一款新型的搜索算法,如今搜索查询变得更加复杂,搜索结果不仅要与字词匹配,还要与概念和意义相匹配。采用新算法后,搜索可以更好地处理更长的、更复杂的问题。

3. “PageRank”算法是否已死?

PageRank,网页排名,是一种由搜索引擎根据网页之间相互的超链接计算的技术,而作为网页排名的要素之一,以Google公司创办人拉里·佩奇(Larry        Page)之姓来命名。Google把从A页面到B页面的链接解释为A页面给B页面投票,Google根据投票来源(甚至来源的来源,即链接到A页面的页面)和投票目标的等级来决定新的等级(来源       Wikipedia)。

不。PageRank只是200个主要“要素”之一,现已融入到Hummingbird算法中。PageRank,这是一个极其重要的页面链接,随着一些复杂的因素,Google开始注重页面的质量问题,基于此,所用的语句以及其他信息都被重新优化(元素周期表的SEO就是个成功的案例)。本次算法改进是基于页面排名与指数的重新思考。

4. 为什么将其命名为Hummingbird(蜂鸟)?

Google称,名字的灵感来源于“精准与快速“。

5. Hummingbird是什么时候启动的?

Google早在一个月前就启动了Hummingbird算法项目。Google只是在9月27日宣布了这一则消息。


Google15周年生日

6. 现在使用Hummingbird意味着什么?

打个比方,这就好比在20世纪50年代创建汽车,它需要一个伟大的引擎,但是该引擎却缺少燃油喷射或者无法使用无铅燃油。

Google发布Hummingbird算法,这就好比汽车放弃旧引擎,更换新引擎。它的动作如此之快,以致无人注意到Google此次部署。

7. Google最近一次发布重大算法是在什么时候?

2010年,Google发布了“Caffeine        Update”(咖啡因)这也是一次重大更新。但这次更新主要是帮助Google更好的收集信息(索引)而不是给信息排序。Google Caffeine给网络开发与SEO带来相当大的冲击。

Google高级副总裁Amit-Singhal表示,此次是三年以来Google规模最大的算法更新,上一次更新是在三年之前的“咖啡因计划”。


8. 如何看待Penguin、Panda及其他版本的更新,难道这些算法没有带来任何改变吗?

Google在2011年2月上线的“Panda”算法,目标是打击各种充满低质量信息的“内容农场”网站,而后来更新的“Penguin”算法,其目标直指通过SEO手段来提高网站排名。

Panda、Penguin以及其他版本的更新只是作为旧算法的一些升级更新,而并非像这次整体替换。

以引擎为例,这就好比该引擎获收获了新的机油过滤器或者改进了泵转速 。虽然Hummingbird是一种全新的引擎,但它仍然使用了一些旧算法特性,包括Penguin和Panda。

原创粉丝点击