PHP 爬小说站
来源:互联网 发布:软件测试自我介绍 编辑:程序博客网 时间:2024/05/02 16:10
原始站点总是弹窗,弹窗就弹窗吧,还有声音,声音还竟是哪种的
虽说可以用chrome屏蔽掉,也可写hosts,但是换个站点还的重新弄,怪麻烦的
<?php$base = 'http://xx/oo/';$start = 'xx.shtml';$content_grep = '/ (.*)<br \/>/';$next_grep = '/href=\'(\d+\.shtml)\'><b>下一页/';$next = $start;$file_name = 'out.txt';while($next) {echo 'getting ' . $next . PHP_EOL;$result = file_get_contents($base . $next);preg_match_all($content_grep, $result, $match);$isTitle = true;$content = "";foreach($match[1] as $line) {if($isTitle) {$content = $line . PHP_EOL . PHP_EOL;$isTitle = false;} else {$content .= ' ' . $line . PHP_EOL . PHP_EOL;}}$file = fopen($file_name, 'a');echo 'write length: ' . strlen($content) . PHP_EOL;fwrite($file, $content);fclose($file);echo '.';preg_match($next_grep, $result, $match);$next = $match[1];}
本文章来至源码世界 http://www.ymsky.net/views/50720.shtml
0 0
- PHP 爬小说站
- PHP处理小说文章内容
- 简单的小说网站爬虫--爬小说
- Python爬取小说
- 爬取起点小说
- python爬取小说
- requests爬取小说
- python 爬小说
- Beautifulsoup爬小说
- 小说
- 小说
- 小说
- 小说
- 小说
- 小说
- 小说
- 小说
- 【小说】
- 散列基础知识
- PHP 使用 session_destroy() 删除 Session 数据
- Debian系Linux设置开机自启动命令update.rc.d
- redhat6安装oracle手册
- poj 3278
- PHP 爬小说站
- 字符串的反串输出问题
- CSMA/CD和CSMA/CA
- 【计算机网络常见面试题】无线局域网的MAC层
- JBOSS EAP 6 系列三 EJB实现—贯穿始终的模块
- 异常链
- 周赛4.D
- Java线程总结(1)
- Android4.4系统设置会多一种语言:Developer Accented English修改问题