curl——登录获取需要的信息

来源:互联网 发布:易语言数据库查找 编辑:程序博客网 时间:2024/05/16 17:16

爬厦门大学勤工助学(i.xmu.edu.cn)岗位的职位及其月薪水。

第一步:登录Cookie
(1)分析登录
①首页
这里写图片描述
②登录(输入学号密码,右键单击->审查元素->Network->√preserve log ->单击登录)
这里写图片描述
③找到相关的加载文件,并查看header信息
这里写图片描述
(2)获取Cookie
这里写图片描述
运行得到
这里写图片描述
获取Cookie成功啦~

第二步:获取勤工助学的全部信息
(1)分析勤工助学页面
①通过信息门户进入学工管理系统
这里写图片描述
这里写图片描述
②分析
由于点开页面的时候可申请岗位的框框有明显的滞后,所以可以猜测这部分的内容是jsp文件。
然后一个个找找看看那个文件符合内容。
这里写图片描述
这个文件就是找到的符合条件的文件啦
③查看文件header信息,寻找我们需要的信息
这里写图片描述
这里我们需要拼接一下form data信息,单击view source 得到
这里写图片描述
这里的form data 作为接下来的代码的$data信息。
④接下来就是写代码啦~
这里写图片描述
运行得到
这里写图片描述
啊啊啊 吓死我了 全是数字
但是不要着急啊~ 鼠标单击右键->查看网页源代码
这里写图片描述
没错吧 确实是我们要的信息 说明我们没做错哦~

第三步:提取出需要的信息(这里我们只需要岗位名称和月工资)
①分析信息的结构
这个是XML信息,所以我们用simplexml_load_string()函数来化简内容
这里写图片描述
运行后页面与代码如下
这里写图片描述
再将record去掉
这里写图片描述
结果如下
这里写图片描述

②组合需要的信息
找到岗位名称和工资相应的索引,然后组合
这里写图片描述
运行结果如下
这里写图片描述

大功告成啦~

0 0
原创粉丝点击