PHP爬虫之刷博客访问量
来源:互联网 发布:python 矩阵相乘 编辑:程序博客网 时间:2024/05/20 04:14
本着学以致用的态度,现在想试试用爬虫技术来刷一刷博客访问量。
学习交流之用,不要瞎搞。
<?php//只需把beginUrl改为你的博客列表首页就可以了$beginUrl = "http://blog.csdn.net/qq_27988539?viewmode=contents";$listpage = file_get_contents($beginUrl);//博客列表可能有多页//获得每一页的链接$pattern ="/<div id=\"papelist\".*>.*<\/div>/sU";$arr = array();if(preg_match_all($pattern,$listpage,$arr)){$str = $arr[0][0];$pattern = "/<a.*>.*<\/a>/sU";$temp1 = array();if(preg_match_all($pattern,$str,$temp1)){$temp1 = $temp1[0];array_splice($temp1,-2);$pages = array();foreach ($temp1 as $key => $value) {$temp2 = array();$pattern = "/\".*\"/U";if(preg_match_all($pattern,$value,$temp2)){$pages[] = $temp2[0][0];}}}}$rooturl = "http://blog.csdn.net";$blogPage = array($beginUrl);if(!empty($pages)){foreach($pages as $key => $value){$pages[$key] = preg_replace("/\"/",'', $value);$blogPage[] = $rooturl.$pages[$key];}}//print_r($blogPage);//获得所有博客的链接$blogUrls = array();foreach($blogPage as $key => $value){$page = file_get_contents($value);$pattern = "/<span class=\"link_title\">.*<\/span>/sU";if(preg_match_all($pattern,$page,$arr)){$arr = $arr[0];foreach($arr as $key => $value){$pattern = "/<a.*<\/a>/sU";$temp3 = array();if(preg_match_all($pattern,$value,$temp3)){$pattern = "/\".*\"/U";$str = $temp3[0][0];$temp4 = array();if(preg_match_all($pattern,$str,$temp4)){$blogUrls[] = preg_replace("/\"/","",$temp4[0][0]);}}}}}//var_dump($blogUrls);//遍历访问所有的博客链接for($i=0;$i<100;$i++){foreach($blogUrls as $value){$blogUrl = $rooturl.$value;file_get_contents($blogUrl);sleep(2);}}?>
阅读全文
0 0
- PHP爬虫之刷博客访问量
- python爬虫之csdn刷博客访问量
- python爬虫设计刷博客访问量(刷访问量,赞,爬取图片)
- 简单CSDN爬虫,实现博客访问量记录
- Python爬虫爬取博客访问量
- python刷博客访问量
- http编程系列(二)——java爬虫实现刷个人博客的访问量
- 如何刷博客的访问量
- 如何刷博客的访问量
- php刷csdn博客访问,爬虫测试
- 爬虫 博客 增加访问量 Jsoup Java 正则 实现
- python项目之 增加博客访问量
- 简单的Python爬虫刷访问量程序
- Node.js批量刷CSDN博客访问量
- 博客秀之增加访问量,看看前人的破解锦囊
- 谈谈工作方式-博客访问量突破70000之时!
- 【Python脚本】-爬虫得到CSDN博客的文章访问量和评论量
- 小爬虫之博客刷博器
- MacPorts 初装后提示 command not found: port 解决方案
- 几个连接HiveServer的客户端界面工具
- Add Two Numbers
- 动态规划
- HDU 6130 Kolakoski数列
- PHP爬虫之刷博客访问量
- 【Unity3D 5.6版本使用(2)】Unity5中WebGL平台封装的一些技巧 (转载)
- json数组遍历的两种方式
- Centos7 通过yum安装pip
- [JSOI2008]星球大战(并查集)
- Bootstrap Table使用整理(三)
- 获取设备的UDID用于给远程手机安装测试包
- 基本类型数组转换列表陷阱(asList)
- D