使用php的curl爬取登陆后的信息

来源:互联网 发布:网络运营商有哪些 编辑:程序博客网 时间:2024/05/01 21:13

<?php//1:curl初始化 $ch = curl_init();//2:设置post数据 $data = array ('post_xuehao' => '13110572068');//3:设置请求的url curl_setopt($ch, CURLOPT_URL, "http://210.44.176.116/cjcx/xhcx_list.php");//4:设置请求的参数curl_setopt ( $ch, CURLOPT_POST, 1 );curl_setopt ( $ch, CURLOPT_HEADER, 0 );curl_setopt ( $ch, CURLOPT_RETURNTRANSFER, 1 );curl_setopt ( $ch, CURLOPT_POSTFIELDS, $data );//保存到文件,以注释// $fop=fopen("test.html", "wr");// if(!$fop){// mkdir("test.html","wr");// }// curl_setopt($ch, CURLOPT_FILE,$fop);//5:执行url,返回结果$re=curl_exec($ch);//6:打印到浏览器echo $re;//关闭curl curl_close($ch);// fclose($fop);?>

因为在近期的开发当中,经常的需要使用爬虫技术用来爬取网站的信息,这里,因为不想过多的再去学习一门新的语言,就使用已经掌握的php作为后台爬取脚本,听说python蛮不错的,但是,那只是听说,反正我用过是不怎么爽的,但是,无论什么言语,起根本的原理是相同的,这里使用curl工具进行爬取,特别注意的是,一定要打开php的curl扩展,否则无法使用,我记得在php5.4.3版本,有个无法解决的bug,就是无法使用curl,在linux上面,现在相关的扩展就可以使用了。下面是具体的实例代码:


0 0
原创粉丝点击