python爬虫解决验证码的思路
来源:互联网 发布:n97i软件下载 编辑:程序博客网 时间:2024/05/18 01:24
如果直接从生成验证码的页面把验证码下载到本地后识别,再构造表单数据发送的话,会有一个验证码同步的问题,即请求了两次验证码,而识别出来的验证码并不是实际需要发送的验证码。有如下几种方法解决。
法1:
用session:
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
法2:
用cookie:
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
法3:
selenium+手动构造cookie: 该方法无需识别验证码,本人尚未尝试。
- 1
- 2
- 3
- 4
- 5
- 6
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
这种方法难点在于确定该网站是用cookie中的什么key值来表示“用户名”和“密码”的。而且好像有些cookie是加密过的。可以先用get_cookies()进行观察。
阅读全文
0 0
- python爬虫解决验证码的思路
- python爬虫解决验证码的思路
- python爬虫解决百度贴吧登陆验证码问题
- 属于自己的Python爬虫思路
- 整理第一个python爬虫的思路
- python爬虫-->验证码处理
- Python 爬虫思路梳理
- 验证码的破解思路
- 网站的验证码思路
- 验证码的破解思路!
- 验证码的破解思路!
- 实现验证码的思路
- 验证码的自动识别思路
- Python爬虫实现验证码登录
- 【Python爬虫7】验证码处理
- Python 爬虫入门(四)—— 验证码下篇(破解简单的验证码)
- Web自动化测试中针对图片验证码问题的常见解决思路
- 爬虫对网站改版快速解决思路
- AS3中的类与属性的修饰符
- 关于tensorflow的好博客
- 如果catch里面有return语句,finally里面的代码还会执行吗?
- Android RecyclerView详解以及滑动删除等
- MySQL创建全文索引
- python爬虫解决验证码的思路
- Python中的logging模块就这么用
- Bean的作用域详解
- JSON 根据Id 过滤重复对象
- 购物车二级列表的完美实现
- Oracle修改表名、主键、索引、外键删除重建
- 将xls表格数据转为点数据(2)
- 本地HTMLajax跨域请求携带cookie数据,请求不会被登录拦截器拦截
- 汉诺塔问题