我图网搜索引擎优化之二:百度,google收录大揭秘
来源:互联网 发布:太原老兵知豆电话 编辑:程序博客网 时间:2024/04/30 12:00
我图网搜索引擎优化之二:百度,google收录模型分析大揭秘
今天说的主要还是google,百度的收录问题。
我们是针对主要的收录模型,做一个大体的分析!
对于收录,其实google和baidu原理原型上差不多.
宗旨:把有用,有价值的信息,反馈给有需要的用户.
在详细说之前,我们先可以一个模型图,
名字解释:
百度蜘蛛:其实就是百度用于到网络上抓取页面的服务器.
百度索引储存器:百度蜘蛛抓取以后,是把所有他能够即时抓取的,都存放在那里.
百度分析器:分析抓取的内容是否有用.
百度网站目录:保存他要去采集的所有网站的列表.
百度蜘蛛的工作原理是:
1. 先到百度网站目录去,抓取一个网址,假设就是你的网站,先进入你首页,然后沿着你首页的连接,不断像部延生,这里大家就知道为什么网页内部连接的重要性了吧.
2. 你的网站没有被收录:这就是为什么你需要到百度那里去提交你的网站或者做友情连接了,很快就会收录的原因. 你在百度提交了你的网站,他就会保存“百度网站目录”里面去,那么他就知道你这个网站了.你和其他网站做了友情连接,其他网站被抓取的时候,也会发现你的网站,那么也会把你的网址保存到“百度网站目录”中去,那么下次,百度蜘蛛也会去抓取你的内容!
3. 百度蜘蛛不是动物也不是很多只,仅仅是抓取页面的服务器.
介绍你用一个百度蜘蛛抓取页面的分析器:http://tool.chinaz.com/Tools/Robot.aspx
从原理模型图大家可以发现,其实,百度蜘蛛是不具有智慧的,他只是简单的按照“百度网站目录”里面的网址去做抓取的工作,抓取以后简单的把内容储存到“百度索引服务器”,存入以后,他就完事情了。
其实,“百度分析器”是这个里面最关键,最为核心的,他掌握着一个网站以及页面的生杀大全.
百度分析器工作原理:
1.网站权重表---类似于google的pr,这个表在一定程度上决定了一个网站价值的大小,这个表是“百度分析器”通过长期的工作,不断分析并且累积的结果.他根据一个网站的流量,导入连接,更新速度,更新质量,页面代码质量,页面内容质量等等内容不断的对一个网站进行评估,做权重的加法,减法,最终慢慢得到这么一张非常有价值的表,并对你网站的页面做出评估.
注意,这张表在“百度网站目录”里面依然有效,“百度网站目录”中保存了一个网站的更新速度,网站权重等重要参数,并且根据这些参数,把网站分成“三六九等”,更新越快,权重越高的有更多的优先权!你一个网站的长期不断的新内容.,稳定的运行,是最为重要的.
2.“百度分析器”根据你网站的权重,以及你每个网页的关键词密度,原创性,网页代码,网页内容,访问速度,赋予一定的权重.如果你的网页不是原创,代码也写的差,相关性也差,可读性也差,那么“百度分析器”认为这个是没有价值的,那么他就不会把这个页面反馈给百度服务器,也就是意味着,你这个页面,用户可能以后很少能够见到.就算被百度收录了,但是因为种种原因,位置太靠后,也就不会产生价值了.
常常有人说百度周3,周4大更新,其实百度对于每一个每天更新,有新内容的网站,他会每天光顾了。
这里参数下“百度蜘蛛”光顾你网站的机理:
一个新的网站,提交到了百度,百度把他加入“百度网站目录”,但是这个时候没有什么权重,但是百度依然会在加入“百度网站目录”以后的1-7天内就开始进入你的网站,进入网站第一个问题就是看你网站的速度,网站代码,网页代码,网页内容,原创新,新颖性进行判断,也就是说,提示百度蜘蛛在你提交网站的1-7天内就光顾了你的网站,并且抓取了页面,并且保存在“百度索引储存器”里面,然后“百度分析器”开始分析,如果网站的速度,网站代码,网页代码,网页内容,原创新,新颖性进行判断都不多,你的首页马上就会被收录,也就是说,这个时候其实“百度分析器”已经在给你的网站权重打分了.接下来的1周内,“百度蜘蛛”其实每天都会光顾,判断你的更新速度,网站权重,如果你网站够好,再周3.4可能就会大量收录一次,当然,也可能只收录一个首页,也可能首页都没有收录.如果你网站保持每天更新,那么“百度分析器”就会记录你的更新速度,并且按照你的更新速度,记录在他的权重表中,并且反馈给“百度网站目录”.
大家看到这里,应该明白,为何有些网站每天有收录,有些几天收录,有些一周收录,有些很久才收录了吧。
因为刚开始百度蜘蛛来很勤快的,发现你更新的慢,他就会编程2-3天来一次,通过1-2周的观察,发现2-3天你都没有更新,接着就变成一周更新一次,如果一周都不更新,百度蜘蛛就会变成2周来一次,3周。。。知道一周再也不来。
大家以为百度蜘蛛有智慧嘛,看出来了吧,其实有智慧的是“百度分析器”,是他分析了结果,并且把结果反馈给“百度网站目录”,百度蜘蛛是根据“百度网站目录”来工作的.
以上基本描述了百度收录的一个大概模型,google和这个类似,因为一开始,百度就是按照google的逻辑在做,只是到了国内,加了一些适应国内环境的规则进去.百度里面其实也有google里面类似于pr的东西,其实他没有公布出来而已.
介绍你使用工具:
1. 百度收录查询工具:http://tool.chinaz.com/baidu/Default.aspx
2. google收录查询工具:http://www.zzsky.cn/tool/google/
这里给大家说一句site命令,
有人说:site:www.ooopic.com首页不在首位或者首页,是网站被降权。其实这个不属实的。
这个不用我理论说明:
site:baidu.com
site:sina.com.cn
site:qq.com
ok,文章就写到这里,感谢你的观看.
我图网搜索引擎优化之一:网站基本构架及其服务器配置
我图网搜索引擎优化之二:百度,google收录模型分析大揭秘
我图网搜索引擎优化之三:网页大结构以及网页内部代码结构(第一篇转载2篇以后我发布)
我图网搜索引擎优化之四:pr计算及其友情连接价值计算(第二篇转载5篇以后我发布)---单个页面权重问题
我图网搜索引擎优化之五:百度,google收录页面权重提高代码分析(第四篇转载20篇以后我发布)
---------待续
文章发表在:(艾瑞咨询,iresearch.cn),版权给我图网 (http://www.ooopic.com)转载请带上,表示我授权你发表.
未带原载地址者,视为盗窃.
有意交流的,请加qq:244109560 注明:seo文章
- 我图网搜索引擎优化之二:百度,google收录大揭秘
- 解密Google、百度搜索引擎揭秘
- 行之有效的seo优化、提高搜索引擎收录之我谏
- 搜索引擎优化之Google与百度对待网站的区别
- Google和百度搜索引擎的网页收录习惯
- 【转】百度和Google搜索引擎收录网站区别
- GOOGLE 百度 YAHOO MSN 搜索引擎如何优化?各大特点是什么?
- 百度之站长FAQ - 收录篇【二】
- Google和百度对我的博客收录时间
- 巧用搜索引擎之百度&Google
- 搜索引擎免费被百度收录
- 百度搜索引擎优化指南2.0(官方版)学习笔记1—面向搜索引擎的网站建设之良好收录1
- 百度,google,yahoo,ASK搜索引擎比较——成功之道在于人心(二)
- 【转贴】智能搜索引擎大收录
- 如何让百度、Google、Yahoo等搜索引擎巨头收录你的网站
- 【转贴】如何让百度,Google等搜索引擎收录你的网站
- 百度、GOOGLE搜索引擎收录减少的9个常见原因和解决办法
- 搜索引擎的Robots规则,如何完全屏蔽百度、google的收录!
- 一些VC的快捷键以及调试方法技巧
- 处理表重复记录(查询和删除)
- redhat AS4两块硬盘做软RAID1
- 未来五年程序员应当具备的十项技能
- C#中利用SMTPClient发送邮件 修改4月15日写的博客
- 我图网搜索引擎优化之二:百度,google收录大揭秘
- 最快搜索算法之二分搜索,最快排序算法之快排【C语言实现】
- 快毕业考试了..
- 我在深圳五年的销售心得
- abap:非主键搜索帮助创建删除重复项的方法
- C语言中的typedef问题
- 温习一下oracle exp/imp命令(转)
- abap 中动态表一例
- 网络文件资源管理系统需要引用到的第三方工具或组件