python中scrapy点击按钮
来源:互联网 发布:java运算类型 编辑:程序博客网 时间:2024/06/09 18:24
最初遇到的问题的是在用scrapy爬取微博时需要按照指定关键字来爬取特定微博,主要还是解决需要输入关键字然后点击搜索按钮的问题。于是:
首先
找了scrapy的官方文档,发现有FormRequest.from_request()函数,于是试着用了,官方文档说函数默认会找到第一个submit的按钮,试了下没有结果,然后把clickdata设成d字典{'name':'button_name'},button_name为按钮的名字,还是没有任何反应(不知道是不是我的问题)。
然后
因为之前有用过selenium写过简单的爬虫,但是爬取的数据到一定程度账号就会被禁止。于是转成scrapy准备用多账号来对付反爬虫。selenium是完全模拟浏览器的行为,click功能自然是与生俱来。所以萌生了,使用selenium来实现点击功能。
但是,这样也需要先登录然后才能实现搜索。怎么登录呢?cookies!于是想利用scrapy的cookies来登录selenium账号,经过了一段时间的探索,最终还是以失败告终。(“error message:cannot only add cookies in current domain”)
最后
在无奈之际,手动搜索了微博,然后点击到下一页。发现链接后缀page=2(当前为第二页),原来第一页后面的链接都是隐藏的,发现这个规律之后,就用规则的方法实现的微博的搜索和页面的跳转!
换个视角会发现世界很美好!
0 0
- python中scrapy点击按钮
- python中 pip install scrapy
- python中scrapy的学习
- 网页中点击增加按钮
- windows上 python中安装scrapy
- Python Scrapy中yield Request的理解
- Win7中Anaconda配置python+Scrapy爬虫
- python中Scrapy的安装详细过程
- python虚拟环境中安装Scrapy
- Python:Scrapy中出现的乱码问题
- python scrapy
- scrapy Python
- python scrapy
- python scrapy
- 在程序中调用按钮点击事件
- Html页面中点击按钮发送邮件
- Android中图片实现按钮点击效果
- js中点击按钮切换图片
- 设计模式之单例模式
- HTML+CSS基础 p font-style设置指定id,字体斜体
- iOS10适配之推送的坑
- HTML+CSS基础 不会随着滚动条变化的固定在右上角的div块
- Tiling
- python中scrapy点击按钮
- Zend Studio 12.5.1汉化
- android调用系统相机拍照
- as编译报错"Task '' not found in root project '***'."
- C++基础--拷贝构造函数
- 我的Android进阶之旅------>Android获取服务器上格式为JSON和XML两种格式的信息的小程序
- C#实现一个最简单的HTTP服务器
- HTML+CSS基础 不会随着滚动条变化的固定在右下角的div块
- ubuntu系统中安装editplus的方法