google和baidu:301重定向的索引记录观察

来源:互联网 发布:淘宝日本代购鱼竿 编辑:程序博客网 时间:2024/04/29 12:16

上月27号开始设置的重定向吧,/about/www-clin003-com-390.shtml 现在去看啦看搜索引擎的索引情况:

google:

约有 97 项符合 wz.mygogou.com 的查询结果,以下是第 1 - 10 项 (搜索用时 0.37 秒)

clin003.com 上约有 449 项符合Lin’s空间的查询结果,以下是第 1 - 10 项 (搜索用时 0.36 秒)

约有 2,650 项符合 clin003.com 的查询结果,以下是第 1 - 10 项 (搜索用时 0.07 秒)

因为clin003.com这个域名下原来挂有内容所以看起来索引会多些,我用 Lin’s空间 就是限制搜索的结果都是这个博客的内容索引情况。

baidu:

site:clin003.com Lin’s空间  ——百度一下,找到相关网页25篇,用时0.052秒

site:wz.mygogou.com  ——百度一下,找到相关网页684篇,用时0.001秒

对比一下baidu对301重定向还是不怎么感冒的,因为301重定向后(时间没精确到具体多长)就没发现wz.mygogou.com的主页面出 现在结果页啦(一般首页是在第一个记录位置的)。而baidu现在还可以看到wz.mygogou.com在第一个位置,并且搜索本站独有的关键字也发现 baidu还是以wz.mygogou.com为主,而clin003.com的所以在省略里边,看截图:

余黛乐wz.mygogou.com  39K 2008-2-17

作为对比再截一图:

余黛乐wz.mygogou.com 39K 2008-2-17  clin003.com 39K 2008-2-17

显然baidu对待301重定向的态度有问题:把clin003.com(定向的目的域名作为copy啦),这很有可能导致受到baidu惩罚(只 是猜想,由于偶的这个博客内容比较少还没怎么感觉到!!),或许baidu迟迟的索引clin003.com的新内容就是征兆。

相对而言google还是很快对301重定向内容作啦比较好的处理:至少搜索site:wz.mygogou.com少啦很多索引记录(也就是说大 部分都转化为clin003.com的索引记录啦),不过这可能也跟我在管理员工具中提交的sitemap文件有关(希望baidu也能提供这样一个工具 来补充baidu的索引策略)。 应该说google在发现wz.mygogou.com 301转向到clin003.com后就没有继续更新wz.mygogou.com内容啦(现在还不确定如果wz.mygogou.com不完全重定向到 clin003.com会不会继续更新wz.mygogou.com内容,我想应该会吧,只是可能会打一下盹而已)

检测wz.mygogou.com的头信息(检测办法):

HTTP/1.0 301 Moved Permanently =>
Date => Mon, 18 Feb 2008 06:35:11 GMT
Server => Apache
X-Powered-By => PHP/4.4.7
Set-Cookie => PHPSESSID=46161ab908eda1b99d824726b1171d5b; path=/
Expires => Thu, 19 Nov 1981 08:52:00 GMT
Cache-Control => no-store, no-cache, must-revalidate, post-check=0, pre-check=0
Pragma => no-cache
X-Pingback => http://clin003.com/xmlrpc.php
Location => http://clin003.com/
Content-Type => text/html; charset=UTF-8
X-Cache => MISS from domain.net
Via => 1.0 domain.net:80 (squid)
Connection => close

以下为补充截图:

约有 97 项符合 wz.mygogou.com 的查询结果,以下是第 1 - 10 项 (搜索用时 0.37 秒)

site:clin003.com截图

约有 2,650 项符合 clin003.com 的查询结果,以下是第 1 - 10 项

百度一下,找到相关网页25篇,用时0.052秒

看来baidu喜欢把“目录页面”放到靠上的位置啊!!(。。)

百度一下,找到相关网页684篇,用时0.001秒

这个图看下时间差baidu的蜘蛛抓取间隔?记得以前都很快抓取的呢,几乎每天都会抓取的!!当然是从这个时间中看出来的,这个间隔有点大吧!!

  from:google和baidu:301重定向的索引记录观察
原创粉丝点击