『Scrapy』日常工作和学习中所遇到的坑及解决办法——长期更新

来源：互联网发布：海淘iphone7知乎编辑：程序博客网时间：2024/06/05 18:35

1、需要点击之后才能看到的内容

可以使用 selenium 模拟点击后再抓取内容，但这里有一个点需要注意的地方是，我们所要查找的内容是在 selenium 模拟点击之后的网页中，故需要写成如下格式：

from selenium import webdriver            import time            driver = webdriver.Chrome()            driver.maximize_window()            sreach_handle = driver.current_window_handle            driver.get(response.url)            time.sleep(5)            driver.find_element_by_xpath('//a[@value="FUNDRAISING"]').click()  # 点击投标中            se = Selector(text=driver.page_source)    # 此处是关键，否则下面将无法抓取到内容            items =[]            product_item = se.xpath('//div[@class="x_investDebt_conLi"]')

0 0

『Scrapy』日常工作和学习中所遇到的坑及解决办法——长期更新
opencv学习中遇到的函数汇集（长期更新）
【Web前端】学习中遇到的问题（长期更新）
日常工作中遇到的那些坑
在Ajax中使用get和post所遇到的问题及解决办法
Android开发中所遇到的错误及解决办法
Scrapy学习中遇到问题及解决的方法
android 开发中遇到的ERROR经常长期更新笔记
我工作中遇到的SQL（长期更新）
记录工作中遇到的一些问题（长期更新）
Scrapy中遇到的坑
Java学习中，所遇到的一些问题及解决方案
日常工作中遇到的异常整理笔记
安卓开发中所遇到的一些问题及解决办法，不断更新中
Android 学习记录及所遇到的坑
所见的GCC和标准C不同的一些语法(长期更新)
AndroidStudio更新所遇到的坑
spring mvc学习中遇到的问题及解决办法
Java递归实现字符串全排列
异常的基本概念
CSS3 动画卡顿解决方案
几种基本的插入排序
Ubuntu12.04下安装配置Android SDK NDK
『Scrapy』日常工作和学习中所遇到的坑及解决办法——长期更新
初识nginx——配置解析篇
Redis快速入门之集合类型
利用tesseract简单识别验证码
listboxItem 动态选择模版
nginx安装ssl证书
hdu1151Air Raid【最小路径覆盖】
ROS探索总结（三）——ROS新手教程
nginx 安装和配置 2个tomcat负载