『Scrapy』日常工作和学习中所遇到的坑及解决办法——长期更新
来源:互联网 发布:海淘iphone7知乎 编辑:程序博客网 时间:2024/06/05 18:35
1、需要点击之后才能看到的内容
可以使用 selenium 模拟点击后再抓取内容,但这里有一个点需要注意的地方是,我们所要查找的内容是在 selenium 模拟点击之后的网页中,故需要写成如下格式:
from selenium import webdriver import time driver = webdriver.Chrome() driver.maximize_window() sreach_handle = driver.current_window_handle driver.get(response.url) time.sleep(5) driver.find_element_by_xpath('//a[@value="FUNDRAISING"]').click() # 点击投标中 se = Selector(text=driver.page_source) # 此处是关键,否则下面将无法抓取到内容 items =[] product_item = se.xpath('//div[@class="x_investDebt_conLi"]')
0 0
- 『Scrapy』日常工作和学习中所遇到的坑及解决办法——长期更新
- opencv学习中遇到的函数汇集(长期更新)
- 【Web前端】学习中遇到的问题(长期更新)
- 日常工作中遇到的那些坑
- 在Ajax中使用get和post所遇到的问题及解决办法
- Android开发中所遇到的错误及解决办法
- Scrapy学习中遇到问题及解决的方法
- android 开发中遇到的ERROR经常长期更新笔记
- 我工作中遇到的SQL(长期更新)
- 记录工作中遇到的一些问题(长期更新)
- Scrapy中遇到的坑
- Java学习中,所遇到的一些问题及解决方案
- 日常工作中遇到的异常整理笔记
- 安卓开发中所遇到的一些问题及解决办法,不断更新中
- Android 学习记录及所遇到的坑
- 所见的GCC和标准C不同的一些语法(长期更新)
- AndroidStudio更新所遇到的坑
- spring mvc学习中遇到的问题及解决办法
- Java递归实现字符串全排列
- 异常的基本概念
- CSS3 动画卡顿解决方案
- 几种基本的插入排序
- Ubuntu12.04下安装配置Android SDK NDK
- 『Scrapy』日常工作和学习中所遇到的坑及解决办法——长期更新
- 初识nginx——配置解析篇
- Redis快速入门之集合类型
- 利用tesseract简单识别验证码
- listboxItem 动态选择模版
- nginx安装ssl证书
- hdu1151Air Raid【最小路径覆盖】
- ROS探索总结(三)——ROS新手教程
- nginx 安装和配置 2个tomcat负载