PHP 爬小说站

来源:互联网 发布:软件测试自我介绍 编辑:程序博客网 时间:2024/05/02 16:10
原始站点总是弹窗,弹窗就弹窗吧,还有声音,声音还竟是哪种的

虽说可以用chrome屏蔽掉,也可写hosts,但是换个站点还的重新弄,怪麻烦的


<?php$base = 'http://xx/oo/';$start = 'xx.shtml';$content_grep = '/&nbsp;&nbsp;&nbsp;&nbsp;(.*)<br \/>/';$next_grep = '/href=\'(\d+\.shtml)\'><b>下一页/';$next = $start;$file_name = 'out.txt';while($next) {echo 'getting ' . $next . PHP_EOL;$result = file_get_contents($base . $next);preg_match_all($content_grep, $result, $match);$isTitle = true;$content = "";foreach($match[1] as $line) {if($isTitle) {$content = $line . PHP_EOL . PHP_EOL;$isTitle = false;} else {$content .= '        ' . $line . PHP_EOL . PHP_EOL;}}$file = fopen($file_name, 'a');echo 'write length: ' . strlen($content) . PHP_EOL;fwrite($file, $content);fclose($file);echo '.';preg_match($next_grep, $result, $match);$next = $match[1];}


本文章来至源码世界  http://www.ymsky.net/views/50720.shtml

0 0
原创粉丝点击