我图网搜索引擎优化之二:百度,google收录大揭秘

来源:互联网 发布:太原老兵知豆电话 编辑:程序博客网 时间:2024/04/30 12:00

 

我图网搜索引擎优化之二:百度,google收录模型分析大揭秘

今天说的主要还是google,百度的收录问题。

我们是针对主要的收录模型,做一个大体的分析!

 

对于收录,其实googlebaidu原理原型上差不多.

宗旨:把有用,有价值的信息,反馈给有需要的用户.

在详细说之前,我们先可以一个模型图,

 

点此在新窗口中查看原始图片

名字解释:

百度蜘蛛:其实就是百度用于到网络上抓取页面的服务器.

百度索引储存器:百度蜘蛛抓取以后,是把所有他能够即时抓取的,都存放在那里.

百度分析器:分析抓取的内容是否有用.

百度网站目录:保存他要去采集的所有网站的列表.

 

百度蜘蛛的工作原理是:

 

1.       先到百度网站目录去,抓取一个网址,假设就是你的网站,先进入你首页,然后沿着你首页的连接,不断像部延生,这里大家就知道为什么网页内部连接的重要性了吧.

2.       你的网站没有被收录:这就是为什么你需要到百度那里去提交你的网站或者做友情连接了,很快就会收录的原因. 你在百度提交了你的网站,他就会保存“百度网站目录”里面去,那么他就知道你这个网站了.你和其他网站做了友情连接,其他网站被抓取的时候,也会发现你的网站,那么也会把你的网址保存到“百度网站目录”中去,那么下次,百度蜘蛛也会去抓取你的内容!

3.       百度蜘蛛不是动物也不是很多只,仅仅是抓取页面的服务器.

 介绍你用一个百度蜘蛛抓取页面的分析器:http://tool.chinaz.com/Tools/Robot.aspx

 

从原理模型图大家可以发现,其实,百度蜘蛛是不具有智慧的,他只是简单的按照“百度网站目录”里面的网址去做抓取的工作,抓取以后简单的把内容储存到“百度索引服务器”,存入以后,他就完事情了。

 

其实,“百度分析器”是这个里面最关键,最为核心的,他掌握着一个网站以及页面的生杀大全.

百度分析器工作原理:
1.
网站权重表---类似于googlepr,这个表在一定程度上决定了一个网站价值的大小,这个表是“百度分析器”通过长期的工作,不断分析并且累积的结果.他根据一个网站的流量,导入连接,更新速度,更新质量,页面代码质量,页面内容质量等等内容不断的对一个网站进行评估,做权重的加法,减法,最终慢慢得到这么一张非常有价值的表,并对你网站的页面做出评估.

注意,这张表在“百度网站目录”里面依然有效,“百度网站目录”中保存了一个网站的更新速度,网站权重等重要参数,并且根据这些参数,把网站分成“三六九等”,更新越快,权重越高的有更多的优先权!你一个网站的长期不断的新内容.,稳定的运行,是最为重要的.

2.“百度分析器”根据你网站的权重,以及你每个网页的关键词密度,原创性,网页代码,网页内容,访问速度,赋予一定的权重.如果你的网页不是原创,代码也写的差,相关性也差,可读性也差,那么“百度分析器”认为这个是没有价值的,那么他就不会把这个页面反馈给百度服务器,也就是意味着,你这个页面,用户可能以后很少能够见到.就算被百度收录了,但是因为种种原因,位置太靠后,也就不会产生价值了.

 

常常有人说百度周3,周4大更新,其实百度对于每一个每天更新,有新内容的网站,他会每天光顾了。

这里参数下“百度蜘蛛”光顾你网站的机理:

一个新的网站,提交到了百度,百度把他加入“百度网站目录”,但是这个时候没有什么权重,但是百度依然会在加入“百度网站目录”以后的1-7天内就开始进入你的网站,进入网站第一个问题就是看你网站的速度,网站代码,网页代码,网页内容,原创新,新颖性进行判断,也就是说,提示百度蜘蛛在你提交网站的1-7天内就光顾了你的网站,并且抓取了页面,并且保存在“百度索引储存器”里面,然后“百度分析器”开始分析,如果网站的速度,网站代码,网页代码,网页内容,原创新,新颖性进行判断都不多,你的首页马上就会被收录,也就是说,这个时候其实“百度分析器”已经在给你的网站权重打分了.接下来的1周内,“百度蜘蛛”其实每天都会光顾,判断你的更新速度,网站权重,如果你网站够好,再周3.4可能就会大量收录一次,当然,也可能只收录一个首页,也可能首页都没有收录.如果你网站保持每天更新,那么“百度分析器”就会记录你的更新速度,并且按照你的更新速度,记录在他的权重表中,并且反馈给“百度网站目录”.

大家看到这里,应该明白,为何有些网站每天有收录,有些几天收录,有些一周收录,有些很久才收录了吧。

因为刚开始百度蜘蛛来很勤快的,发现你更新的慢,他就会编程2-3天来一次,通过1-2周的观察,发现2-3天你都没有更新,接着就变成一周更新一次,如果一周都不更新,百度蜘蛛就会变成2周来一次,3周。。。知道一周再也不来。

大家以为百度蜘蛛有智慧嘛,看出来了吧,其实有智慧的是“百度分析器”,是他分析了结果,并且把结果反馈给“百度网站目录”,百度蜘蛛是根据“百度网站目录”来工作的.

 

以上基本描述了百度收录的一个大概模型,google和这个类似,因为一开始,百度就是按照google的逻辑在做,只是到了国内,加了一些适应国内环境的规则进去.百度里面其实也有google里面类似于pr的东西,其实他没有公布出来而已.

 

介绍你使用工具:

1.       百度收录查询工具:http://tool.chinaz.com/baidu/Default.aspx

2.       google收录查询工具:http://www.zzsky.cn/tool/google/

 

这里给大家说一句site命令,

有人说:sitewww.ooopic.com首页不在首位或者首页,是网站被降权。其实这个不属实的。

这个不用我理论说明:

site:baidu.com

site:sina.com.cn

site:qq.com

 

ok,文章就写到这里,感谢你的观看.

我图网搜索引擎优化之一:网站基本构架及其服务器配置

我图网搜索引擎优化之二:百度,google收录模型分析大揭秘

我图网搜索引擎优化之三:网页大结构以及网页内部代码结构(第一篇转载2篇以后我发布)

我图网搜索引擎优化之四:pr计算及其友情连接价值计算(第二篇转载5篇以后我发布)---单个页面权重问题

我图网搜索引擎优化之五:百度,google收录页面权重提高代码分析(第四篇转载20篇以后我发布)

---------待续

文章发表在:(艾瑞咨询,iresearch.cn),版权给我图网 (http://www.ooopic.com转载请带上,表示我授权你发表.

未带原载地址者,视为盗窃.

有意交流的,请加qq:244109560  注明:seo文章

原创粉丝点击