百度蜘蛛模拟
来源:互联网 发布:虚拟mac识别iphone 编辑:程序博客网 时间:2024/05/23 19:19
function
$ci = curl_init();
$user_agent =
//curl_setopt($ci,CURLOPT_PROXY,'74.125.71.99');
curl_setopt($ci, CURLOPT_URL, $url);
curl_setopt($ci,CURLOPT_HEADER,
curl_setopt($ci, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ci,CURLOPT_REFERER,
curl_setopt($ci, CURLOPT_USERAGENT,$user_agent);
$temp=curl_exec($ci);//执行CURL会话
curl_close($ci);
return
}
$url='www.google.com.hk';
$data=imitateSpider($url);
print_r($data);
baiduspider在爬取网页时,发送请求的User-Agent字段内容将更新。
目前的字段内容是
Baiduspider+(+http://www.baidu.com/search/spider.htm)
更换后的字段内容是
Mozilla/5.0 (compatible;Baiduspider/2.0;+http://www.baidu.com/search/spider.html)
当然也可以修改成不同浏览器或者移动设备。对于蜘蛛模拟还可以做一样事情,那就是当蜘蛛过来的时候,呈现的内容是符合蜘蛛口味,比如一些关键词的堆砌(SEO优化),对于浏览器或移动设备访问(人),呈现的内容是另外一种正常的文章,为的是用户体验。
- 百度蜘蛛模拟
- 百度蜘蛛观察
- 百度蜘蛛什么时候出来
- 勾引百度,引诱蜘蛛
- 关于百度蜘蛛(Baiduspider)
- 吸引百度蜘蛛
- 关于百度蜘蛛ip
- 百度蜘蛛IP分析
- 【SEO名词解释】百度蜘蛛
- 百度蜘蛛 禁止访问
- 百度蜘蛛工作表
- bzoj1092 蜘蛛难题 模拟
- 使用 Apache HttpClient 工具模拟百度蜘蛛或浏览器抓取和解压gzip网页
- 【深入蜘蛛】百度蜘蛛IP段详解
- 浅谈百度蜘蛛的爬行
- 常见的百度蜘蛛IP
- 如何百度蜘蛛喜欢你
- 【百度蜘蛛爬取问题】
- php采集如何越过对方的IP限制
- php采集时被封ip的解决方法
- 搜索引擎爬虫蜘蛛的USERAGENT大全
- php获取远程数据,避免页面卡死问…
- 为ckeditor添加行距的功能
- 百度蜘蛛模拟
- yii CButtonColumn 按钮
- APC和Memcache的区别及优劣对比
- Windows下搭建Memcache
- 让你拥有超常记忆力的小习惯
- Subversion安装及配置
- MySQL主从复制及使用AMOEBA实现读…
- YII联表查询
- Yii框架中GridView按钮调用JS