Python爬虫实践(10):实例2教务系统登录
来源:互联网 发布:新速特软件站下载 编辑:程序博客网 时间:2024/04/29 16:59
打开登录首页,表面上,我们的url应该是:http://grdms.bit.edu.cn/yjs/login.jsp
按F12,查看页面元素如下图:
看到提交方式为post,action后边接的应该是我们提交用户名密码的网站,猜测是:http://grdms.bit.edu.cn/yjs/login.do
为了验证猜想,登录之后F12查看network:
这个才是我们所需要的URL
继续下拉查看需要传入的数据,可以看到需要传入用户名密码,分别是:`j_username:`和‘j_password’:
其他两个,loginType 和Submit 通常来说也需要写,但是由于学校使用的这个什么 iframe 比较变态,即使写了也得不到完整的HTML源码。写和不写效果一样。如果要写,这个Submit 由于编码问题无法显示,其实这就两个选项:‘登 录’和’重 置‘,在登录界面查看源码可以看出:
好了,上代码:
# _*_ coding:utf-8 _*_import urllib2import urllibimport cookielibimport reclass BIT: def __init__(self): self.loginUrl = 'http://grdms.bit.edu.cn/yjs/login.do' self.cookies = cookielib.MozillaCookieJar() self.post_data = urllib.urlencode({ 'j_username': '222XXXX', 'j_password': 'XXXX', }) self.opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(self.cookies)) def get_page(self): request = urllib2.Request( url=self.loginUrl, data=self.post_data, ) result=self.opener.open(request) # 打印登录内容 print result.read().decode('gbk')bit=BIT()bit.get_page()
运行结果:
本以为模拟Cookie登录失败,但是其实这已经是成功登录了,此时如果用Cookie打开一个页面,比如成绩查询页面,是能够成功打开的但是扒下来的代码为什么这么少,这是个难点。
iframe这东西值得深究
0 0
- Python爬虫实践(10):实例2教务系统登录
- Python爬虫实战——模拟登录教务系统
- python爬虫登录正方教务管理系统获取成绩数据
- python爬虫获取强智科技教务系统学科成绩(模拟登录+成绩获取)
- python爬虫正方教务系统
- python爬虫正方教务系统
- [Python]北京交通大学研究生教务系统爬虫
- python 爬虫登陆学校教务系统
- 哈工大(深圳)教务系统Python爬虫1.2
- 哈工大(深圳)教务系统Python爬虫1.3
- python爬虫实战之模拟正方教务系统登录查询成绩
- python爬虫实战之模拟正方教务系统登录查询成绩
- 爬虫实践---正方教务系统爬取历年成绩
- 数据抓包(网络爬虫)-正方教务管理系统登录
- 数据抓包(网络爬虫)-正方教务管理系统登录
- java爬虫之登录到教务系统抓取成绩
- 教务系统爬虫
- python爬虫实例—获取北邮教务GPA
- Q_GLOBAL_STATIC
- 使用/proc/stat文件,用php计算CPU使用率、内存使用率
- Spring项目中使用webservice实现h5的websocket通信
- HTML兼容性指导方针
- 爱与恨
- Python爬虫实践(10):实例2教务系统登录
- C++学习历程及感受
- 关于自己在学习java路程上的所思所想(三)
- Javascript 数组循环遍历之forEach
- GitHub Top 100的Android开源库
- 【bzoj2595】[Wc2008]游览计划 斯坦纳树
- Android节能相关
- swift 编写欢迎界面-- ios开发
- AFN中POST请求提交数据的方式及一些问题