google baidu yahoo spider

来源:互联网 发布:多媒体教学软件中学 编辑:程序博客网 时间:2024/05/17 01:59

最近做了一个部门的主页网站,观测后台数据库抓取到的IP的一点感想

MySql的select语句,用于统计Ip访问次数

SELECT sum(访问次数) FROM `IpCount` WHERE IP like 'XX%'

以下MySql语句是通过观测Ip范围写的,针对目前数据库中的数据是准确的,如果需要统计全部就得用字符串比较代替like

嗯,好像还有点麻烦

220.181.5.1--220.181.7.255 百度IP的起始地址,不一定准确
SELECT sum(访问次数) FROM `IpCount` WHERE IP like '220.181.7%'
结果为:126


203.208.32.1--203.208.63 谷歌中国IP的起始地址,不一定准确
SELECT sum(访问次数) FROM `IpCount` WHERE IP like '203.208.60%'
结果为:31


202.160.176.1--202.160.191.255 雅虎中国IP的起始地址,不一定准确
202.160.178.1--202.160.184.255 雅虎中国蜘蛛IP的起始地址,不一定准确
SELECT sum(访问次数) FROM `IpCount` WHERE IP like '202.160%'
结果为:71

在百度、google中国、yahoo中国上分别搜索

XX大学 XX处

关键字

google的搜索结果头条是该网站主页,下面的次标题是该网站下的另外两个导航(这种技术真是NB)

第二条是学校主页

yahoo的搜索结果头条是学校主页,第四条是该网站主页

baidu的搜索结果头条也是学校主页,我翻了三页,没找到该部门主页

再结合一下上面的访问次数,差距就是这么产生的 啊

百度最大中文搜索引擎的位置不知道还能坐多久

原创粉丝点击