scrapy 的crawl模板模拟登陆
来源:互联网 发布:钢雨篷荷载计算软件 编辑:程序博客网 时间:2024/05/22 21:52
##替换原来的start_requests,callback为def start_requests(self): return [Request("http://www.zhihu.com/#signin", meta = {'cookiejar' : 1}, callback = self.post_login)]def post_login(self, response): print 'Preparing login' #下面这句话用于抓取请求网页后返回网页中的_xsrf字段的文字, 用于成功提交表单 xsrf = Selector(response).xpath('//input[@name="_xsrf"]/@value').extract()[0] print xsrf #FormRequeset.from_response是Scrapy提供的一个函数, 用于post表单 #登陆成功后, 会调用after_login回调函数 return [FormRequest.from_response(response, #"http://www.zhihu.com/login", meta = {'cookiejar' : response.meta['cookiejar']}, headers = self.headers, formdata = { '_xsrf': xsrf, 'email': '1527927373@qq.com', 'password': '321324jia' }, callback = self.after_login, dont_filter = True )]#make_requests_from_url会调用parse,就可以与CrawlSpider的parse进行衔接了def after_login(self, response) : for url in self.start_urls : yield self.make_requests_from_url(url)
阅读全文
0 0
- scrapy 的crawl模板模拟登陆
- 【scrapy】模拟登陆知乎
- scrapy的basic模板模拟登录、requests模拟登录
- scrapy遇到的常见错误-Unknown command: crawl
- scrapy遇到的常见错误-Unknown command: crawl
- 使用scrapy模拟登陆一般登陆不了的网站[已解决]
- scrapy(二)之模拟登陆实现抓取
- [Scrapy]模拟登陆并获取Cookie值
- [Scrapy]模拟登陆并获取Cookie值
- Scrapy模拟登陆知乎流程图
- scrapy爬取某网站,模拟登陆过程中遇到的那些坑
- scrapy源码学习 - 启动一个crawl命令
- Scrapy中用cookie模拟登陆新浪微博
- python爬虫 scrapy框架 知乎zhihu 模拟登陆
- scrapy框架半自动处理验证码豆瓣网模拟登陆
- Scrapy——模拟登陆爬取github issues
- 使用scrapy 模拟登陆网站后 抓取会员中心相关信息
- (案例六)三种scrapy模拟登陆策略
- HDU 4605 Magic Ball Game (在线主席树|| 离线 线段树)
- python同步应用:多个线程有序执行
- 【FirstKotlinApp】使用Kotlin封装6.0的权限请求流程
- Error:Execution failed for task ':transformClassesWithJarMergingForDebug'. > com.android.build.api.t
- JS登录表单验证 正则验证
- scrapy 的crawl模板模拟登陆
- 基于.net2.0的汽车电子CCP协议的封装
- Django中多种重定向方法使用
- 【步兵 shader】基础篇
- 《高质量 C++/C 编程指南 》阅读笔记(四)
- 2017年网易内推笔试编程题1
- 实现一个Promise-polyfill
- NOIP 2009 提高组 复赛 trade 最优贸易
- 个人初学bootstrap并搭建后台界面代码