Google:爬行、索引和排名

来源:互联网 发布:java float 大小 编辑:程序博客网 时间:2024/04/30 01:51
这将是一个系列,内容是我去年对《SEO艺术》这本书的读书笔记。
 
由于是读书笔记,所以可能不会太系统太全面,我只记了我自己觉得有用的,或者说工作时对新人培训需要用到的,如果对内容有疑惑,欢迎留言讨论。
 
对于有经验的人来说,可能会觉得有些东西过于简单,此时也别喷,或者觉得我在水,毕竟我写博客不是单纯为了显高深,我也希望能够普及比较正统的SEO手法。
 
首先介绍下这本书
毫不夸张地说,这本书的阵容就像前天纪念张国荣演唱会那样豪华。对于几个作者介绍,我直接采用本书序言里面的介绍。
 
作者之一, Eric Enge,SEO顾问公司 Stone Temple Consulting创始人。他的博客最大看点是对搜索行业人士的访谈,不仅访谈了大量著名 SEO人士,如 Aaron Wall、Rand Fishkin(本书另一个联合作者)、Bruce Clay、Eric Ward等,更难得的是访谈搜索引擎公司内部人士,如我们熟知的 Matt Cutts、John Mueller以及不太经常对 SEO人士发言的 Google、微软、雅虎等公司的核心成员。很多关于搜索引擎算法的细节是通过这些访谈确认的。其交游之广、与搜索引擎内部人员联系之多,使他的 SEO知识、经验弥足珍贵。
作者之二, Stephan Spencer,著名 SEO服务公司 Netconcepts创始人, SEO技术平台 GravityStream发明人。 Netconcepts公司创立于 1995年,于 2010年被 Covario(另一家 500强级别的搜索营销公司)收购。 Stephan Spencer对 SEO技术层面的掌握非常透彻,这充分体现在 GravityStream系统中。 GravityStream以近乎隐藏页面的原理,在不改动底层架构的情况下优化网站表现层结构和页面,并得到 Google首肯,认定其不属于隐藏页面作弊。
作者之三, Rand Fishkin,SEOmoz创始人、 CEO。 Rand Fishkin是国内及国际范围最受欢迎、大家最熟悉的 SEO人之一,他的博客是我个人最为推荐的 SEO必读。 SEOmoz的网络版 SEO教程、每两年一度的搜索引擎排名因素调查、对排名因素进行较为科学的统计分析在业内有广泛影响。 Rand Fishkin和 SEOmoz颇为传奇。 Rand Fishkin个人在 2005年时还因为运营网站设计公司而负债 50万美元; 2006年左右已成为最负盛名的 SEO公司之一, 2007年开始带领公司成功转型为 SEO软件提供商,现在已经完全不提供 SEO顾问咨询类的服务; 2007年 11月获 110万美元风险投资, 2010年其会员制软件服务收入 570万美元。
作者之四, Jessie Stricchiola,搜索营销公司 Alchemist Media创始人。她是唯一我以前不熟悉的作者,但了解了前面 3位作者就知道这位也显然非等闲之辈。
而翻译这本书的人,更是大家所熟悉的大神——Zac。
 
所以,看到这样的阵容,SEOer们能错过这本书吗?好了,前戏做足了,现在进入正题。
 
爬行和索引
网页就是一个个的地铁站,而链接就是轨道,蜘蛛顺着链接爬行,从而发现一个个的网页。
 
抓取网页后,就开始分析网页代码,把页面上选出来的信息存入服务器,等待调用。
 
一般来讲,我们认为蜘蛛是从一些被信任的网站作为起点开始爬行,所以,与信任网站距离越近,对网站越好。
 
所以从这几句简单的话,我们至少可以获得2点有用的东西:
 
外链来源网站越权威,我们自己的网站就越受信任,信任度是一个非常重要的排名因素。
当我们有新页面发布时,去一些权威网站(如社交网站,书签站等)传播一下页面链接,对收录是有帮助的,因为这些网站是蜘蛛经常光临的。不过要注意,前提是这个网站允许蜘蛛爬行。对于Google SEO来说,每当我有新内容发布时,都会去G+, Twitter, FB, 以及一些主流书签网站传播页面链接,经过我反复测试,我不做这样的行为,页面被收录往往需要2天,而做这样的事情后,一般12小时内收录。(2天收录是我网站的平均收录时间,很多著名的信任度高的博客,往往1小时内就收录,不过他们的网站SEO基础已经非常好了,这样的速度是必然的)
 
检索和排名
用户搜索某一个Query(可以理解为关键词)后,搜索引擎做两件事
1. 只返回与Query相关的结果; (相关度)
2. 按重要程度进行排名 (受信任,权威度,受欢迎,被引用次数,等等)
 
评估网页内容
导航元素不会被忽略,但是对于决定页面的独特内容,只有正文才能起到帮助作用。
 
用一副截图来表达这句话的意思:
 
正文决定页面独特内容
 
也就是说,只有正文部分的内容,才是让Google决定你的页面真正内容的部分,换句话说,Google把你的页面索引到哪个关键词上面,主要看这一部分的内容。
 
导航元素被会爬行及抓取,但是他们不会决定你的页面的独特内容,所以说,在导航元素里面堆砌关键词意义不大。
 
说句题外话,就算是在正文部分,我们也不要堆砌关键词。 Google对于内容及语义的判断已经达到一个相当智能的水平(我最近一年通读了2个版本的Google对于页面质量判定的Guideline文件,对这一点印象非常深刻),我可以非常负责任地说,堆砌关键词对Google没有意义。