scrapy学习记录0401
来源:互联网 发布:java中classpath和path 编辑:程序博客网 时间:2024/06/07 14:39
问题:
- 1.属性中是链接,网页显示是字,如何提取这个字呢?(text()结果如果是网址,可以用string进行转换,如
ip.xpath('string(td[5])')[0].extract()
? - 2.为何我不能再xpath中使用[]的功能?像
td[4]
这种
如ip. xpath('td[4]/text()')[0].extract()
- 3.爬取的网页浏览器能打开,再cmd里就是403,为没有权限访问此站。 百度股票是403,西刺是500.
待实践:
- 1.
response.css('.stock-bets').css('.bets-name').extract()[0]
历史错误:
- 1.
return scrapy.Request(urls, callback=self.parse_stock)
这里的urls不能是列表。 - 2.忘了写yield也是醉了。用以下代码发现的。
from scrapy.shell import inspect_response
inspect_response(response, self) - 3.取某标签的值时把标签写错了导致结果为空[].
css/xpath用法总结:
- 1.区别看清楚了:
- 1)
xpath('//a/@href')
与css('a::attr(href)')
- 2)
xpath('//title/text()')
与css(title::text)
- 3)当不只一个属性时,xpath要用contains, css要用*:
- 1.
xpath('//a[contains(@href,"image")]/@href'</li>
css(‘a[href*=”image”]::attr(href)’)
<li>2.</li></ul></li>
xpath(‘div[@id=”quotesearch”’]/`
<li>4)一个属性时:
- 1.
- 1)
0 0
- scrapy学习记录0401
- 【Scrapy】学习记录1_一个基本的Scrapy项目
- 学习搭建scrapy,记录遇到的问题
- 【Scrapy】学习记录2_爬虫Spider
- 爬虫框架Scrapy学习记录I--ing
- scrapy 记录
- 爬虫框架Scrapy学习记录II--Selector学习
- 【scrapy】学习Scrapy入门
- <scrapy>scrapy入门学习
- 【scrapy】学习Scrapy入门
- 【Scrapy】学习记录3_编写简单爬虫
- 【学习记录】利用scrapy爬取论坛图片
- Scrapy爬虫学习中遇到的问题记录
- Scrapy学习
- scrapy学习
- Scrapy学习
- Scrapy 学习
- scrapy学习
- 初识Meteor
- 异或今日头条笔试
- HBase学习-表的增删改插
- 【机器学习 基本概念】高斯分布
- J2EE项目系列(四)--SSM框架构建积分系统和基本商品检索系统(Spring+SpringMVC+MyBatis+Lucene+Redis+MAVEN)(2)建立商品数据库和Lucene的搭建
- scrapy学习记录0401
- 安卓反编译记录
- Wolf从零学编程-用Python打造简单加密程序(五)
- JZOJ1282.【USACO题库】3.2.1 Factorials阶乘
- 反向传播神经网络(BP网络)介绍及Java实现
- android:configChanges
- C语言中隐藏输入的代码
- 欢迎使用CSDN-markdown编辑器
- adb 坑之第三方手机管家如腾讯统一360 刷机助手导致开发出现严重问题解决方案