搜索引擎的性情

来源:互联网 发布:永远热泪盈眶 知乎 编辑:程序博客网 时间:2024/05/17 04:51

蜘蛛篇
百度 Baiduspider
百度对html页面过度的偏爱,生成静态页的网站更可能也会更快的为百度所收录,而动态扩展名页面,特别是含有大量参数、中文参数的页面,将很难被百度索引。当然,静态页面索引后的更新期往往比较长,即便你使用URLRewrite等一些伪静态的方法,百度虽然抓取到你最新的页面,但索引往往却是以前的。

Google Googlebot
一个新站,在没有提交任何搜索引擎时,往往最先到达的就是Googlebot,可见Google蜘蛛的分布非常广泛,但往往Googlebot访问后并不会立即索引你的网站,直到一段时间后,Googlebot才会向更深层次进行爬行。Google不像百度那太过偏爱静态页,而且索引的更新也更快。Sitemap做为辅助工具可以帮助网站管理人员了解蜘蛛爬行的情况和搜寻那些蜘蛛比较难以到达的页面,但这并不会加速Google索引网页。对于新站而言,被Google索引可能将是一个漫长的过程。

Yahoo Yahoo!+Slurp
Yahoo并不算一个活跃的蜘蛛,索引的深度也并不广泛,被Yahoo收录并不容易,特别是收录大量的页面。

搜狗 sogou+spider
做为新兴的搜索引擎,Sogou已明显有赶超Yahoo的态势,即便是新站,Sogou Spider也会疯狂爬行并收录,Sogou Spider和他的广告一样偏爱成人内容,如果你的页面含有这些词汇,将有可能更快的被Sogou所收录。

爱问 iaskspider
虽然搜索并非新浪的主要方向,但基于新浪流量,爱问也不可小视。iaskspider更加喜欢收录一些学术论文、问答、文档等内容,这也与爱问的特点所保持一致。

MSN msnbot-media
MSN显然仍不是一个中文的搜索引擎,而电信基于LIVE技术推出的114搜索引擎也只算个半成品,但考虑到VISTA即将发布和大量浏览器默认的搜索,MSN将更多受到关注。当然前提是微软能推出一个真正的中文搜索引擎。


搜索篇
作为中文搜索引擎的先锋,百度以优秀的中文分词赢得更多用户的亲睐,相比之下,Google在分词方面已明显落后于百度,特别是当关键词较多时,百度仍能很好的匹配到相关的结果,而Google则会出现大量完全和关键词无关的记录。所以用搜索记录数来恒量搜索质量是非常可笑的,前不久有个网友给我的网站提出了不少意见,最后告诉我,在搜索“公”的记录甚至比搜索“公司”还少,你的索引明显需要改进,对此,真是无语了。
百度令人指责的是其排序规则,虽然百度已经将大量搜索结果广告转移至右侧,但左侧广告仍然严重的影响了使用者的搜索体验。百度不会像Google那样关心广告的质量,而广告主的水平普遍较低也导致大量无关关键词的出现,影响了搜索结果。造成很多使用者不会再去点击百度排名前几位的网站。由于百度不再关注META标签,而且大部份SEO技术对百度来说是免疫的,所以百度的排序规则变得更加简单,大量的链接指向+关键词将可获得不错的排名,但对于任何一个网站来说,对所有的关键词进行优化显然不可能,只要关键词略有变化,网站的排序将发生很大的变化。大量站点靠这样细微的差别生存,但也造成用户对搜索结果重复信息的不满。在信息过滤方面,Google显然做得更好。
 
今天暂时就写这么多了, 关于搜索引擎相关的技术, 也可访问http://www.e2web.cn 查询, 不用人问我能不能共享这个源码, 我想是没有问题的, 当然现在还不行

原创粉丝点击