网页爬虫-用PHP的拓展库curl实现模拟登录慕课网
来源:互联网 发布:linux 内核版本 编辑:程序博客网 时间:2024/06/05 06:49
网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。
<?php //登录慕课网 $username = "账号"; $data='username=账号&password=密码&remember=1'; $curlobj = curl_init(); // 初始化 curl_setopt($curlobj, CURLOPT_URL, "http://www.imooc.com/user/login"); // 设置访问网页的URL curl_setopt($curlobj, CURLOPT_RETURNTRANSFER, true);// 执行之后不直接打印出来 /* Cookie相关设置,这部分设置需要在所有会话开始之前设置 */ //启用时curl会仅仅传递一个session cookie,忽略其他的cookie curl_setopt($curlobj,CURLOPT_COOKIESESSION,TRUE); //设置cookie文件 curl_setopt($curlobj, CURLOPT_COOKIEFILE, "mycookie"); //cookie读取 curl_setopt($curlobj, CURLOPT_COOKIEJAR, "mycookie"); //变量名为session_name()获取的名称,值通过session_id()获取 curl_setopt($curlobj,CURLOPT_COOKIE,session_name().'='.session_id()); curl_setopt($curlobj,CURLOPT_HEADER,0); //这样能够让curl支持页面链接跳转,即可以到达我们想要的页面 curl_setopt($curlobj, CURLOPT_FOLLOWLOCATION, 1); //设置post方式提交 curl_setopt($curlobj, CURLOPT_POST, 1); //设置post数据,post可以是数组,也可以是拼接 curl_setopt($curlobj, CURLOPT_POSTFIELDS, $data); curl_setopt($curlobj, CURLOPT_HTTPHEADER, array("application/x-www-form-urlencoded; charset=utf-8", "Content-length: ".strlen($data))); curl_exec($curlobj); //设置cookie文件 curl_setopt($curlobj, CURLOPT_COOKIEFILE, "mycookie"); //cookie读取 curl_setopt($curlobj, CURLOPT_COOKIEJAR, "mycookie"); //变量名为session_name()获取的名称,值通过session_id()获取 curl_setopt($curlobj,CURLOPT_COOKIE,session_name().'='.session_id()); //打开个人中心页面 curl_setopt($curlobj, CURLOPT_URL, "http://www.imooc.com/space/index"); //下载网页不是post操作,所以需要重新设为0 curl_setopt($curlobj, CURLOPT_POST, 0); curl_setopt($curlobj, CURLOPT_HTTPHEADER, array("Content-type: text/xml")); $output = curl_exec($curlobj); curl_close($curlobj); echo $output;
填上自己的账号密码,运行后即可抓取到自己慕课网的个人中心页面..
阅读全文
0 0
- 网页爬虫-用PHP的拓展库curl实现模拟登录慕课网
- PHP之CURL实现含有验证码的模拟登录
- php curl 实现模拟登录教务处
- php后台“爬虫”模拟登录第三方系统(一)---cURL的介绍
- linux curl模拟登录网页
- php curl模拟登录discuz并模拟发帖的实现方法
- php curl 模拟登录网站
- php curl 模拟cookie登录
- PHP利用curl实现爬虫
- php的curl拓展post提交问题
- [求助]PHP Curl 模拟登录问题
- PHP获取Cookie模拟登录CURL
- PHP CURL 模拟登录 SINA 微博
- PHP curl 模拟登录并获取数据
- PHP获取Cookie模拟登录CURL
- php 使用curl模拟登录人人网
- PHP CURL模拟登录抓取数据
- PHP CURL模拟登录 获取数据
- 几种进程间的通信方式
- Java数组
- 热管理设计Taitherm (ex-Radtherm) v12.1.1 Win64 & Linux64 2CD
- BZOJ 1009-GT考试(kmp+矩阵快速幂+DP)
- 1.并发编程—— 线程安全(一)
- 网页爬虫-用PHP的拓展库curl实现模拟登录慕课网
- 并发
- 视图控制器的生命周期方法
- Qt绘图程序
- classpath、path、JAVA_HOME的作用及JAVA环境变量配置
- hadoop计算单词出现次数
- 跟我一学linux基础(第四天)
- 剑指offer:跳台阶
- 关于代码的优化