第2.3章 scrapy之selenium
来源:互联网 发布:数据恢复精灵免费版 编辑:程序博客网 时间:2024/05/29 19:58
将selenium应用到scrapy本身并不复杂,复杂的是请求页面的时候,经常会提示timeout,而你很难很快找到解决办法,下面设置了两个时间点,单位为s,超时时间根据各自的应用决定。
import sysimport timeimport randomimport tracebackfrom selenium.common.exceptions import TimeoutExceptionreload(sys)sys.setdefaultencoding('utf8')from pyquery import PyQuery as pqimport scrapyfrom selenium import webdriverfrom selenium.webdriver.common.by import Byfrom selenium.webdriver.support.ui import WebDriverWaitfrom selenium.webdriver.support import expected_conditions as ECclass EListSpider2(scrapy.Spider): name="e_list_spider2" def __init__(self,*args, **kwargs): super(EListSpider2, self).__init__(*args, **kwargs) self.start_urls = ['http://s.weibo.com/weibo/'] fp = webdriver.FirefoxProfile() fp.set_preference('http.response.timeout', 360) self.driver = webdriver.Firefox(firefox_profile=fp) def parse(self,response): try: self.driver.set_page_load_timeout(360) self.driver.get("http://s.weibo.com/weibo/") except Exception,e: print u'出现异常', type(e) print traceback.print_exc() print u'正在浏览器中打开页面' try:# self.driver.set_page_load_timeout(5) self.driver.maximize_window() except Exception,e: print u'出现异常', type(e) print traceback.print_exc() print u'浏览器最大化' time.sleep(random.uniform(2,3)) print '-------------------------------------over---------------------------'
阅读全文
0 0
- 第2.3章 scrapy之selenium
- 第1.3章 scrapy之动态UserAgent
- 第1.4章 scrapy之setting
- 第1.5章 scrapy之pipelines
- 第1.6章 scrapy之logger
- 第3.2章 scrapy之kafka
- 第4.1章 scrapy之web工程
- Scrapy之路第一篇
- 第3.1章 scrapy之pandas操作Mysql
- 第1.7章 scrapy之ip代理的使用
- 第1.8章 scrapy之splash的使用
- 第1.8章 scrapy之完整工程部署
- Scrapy and Selenium
- python+scrapy+selenium爬虫
- scrapy selenium 爬虫
- Scrapy+Selenium+Phantomjs Demo
- python+scrapy+selenium结合
- 第三章 将 selenium集成到scrapy中
- 比较一个类的两个对象是否相同
- http://www.znds.com/tv-360538-1-1.html
- 基于Cat的分布式调用追踪
- C++ 操作Excel-----用OLE读写
- 算法概论8.9
- 第2.3章 scrapy之selenium
- Creo Elements/Pro 5.0+Visual Studio 2008二次开发环境配置
- iOS
- 外部中断EXTI的配置注意事项
- java类初始化顺序
- jquery不起作用的原因
- PHP魔术变量
- 深入理解HTTP协议(转)
- CppWindowsService