程序博客网 > java中classpath和path

scrapy学习记录0401

来源：互联网发布：java中classpath和path 编辑：程序博客网时间：2024/06/07 14:39

问题：

1.属性中是链接，网页显示是字，如何提取这个字呢？（text()结果如果是网址，可以用string进行转换，如ip.xpath('string(td[5])')[0].extract()?
2.为何我不能再xpath中使用[]的功能？像td[4]这种
如ip. xpath('td[4]/text()')[0].extract()
3.爬取的网页浏览器能打开，再cmd里就是403，为没有权限访问此站。百度股票是403，西刺是500.

待实践：

1.response.css('.stock-bets').css('.bets-name').extract()[0]

历史错误：

1.return scrapy.Request(urls, callback=self.parse_stock)这里的urls不能是列表。
2.忘了写yield也是醉了。用以下代码发现的。
from scrapy.shell import inspect_response inspect_response(response, self)
3.取某标签的值时把标签写错了导致结果为空[].

css/xpath用法总结：

1.区别看清楚了：
- 1) xpath('//a/@href')与css('a::attr(href)')
- 2) xpath('//title/text()')与css(title::text)
- 3)当不只一个属性时，xpath要用contains， css要用*:
  - 1.xpath('//a[contains(@href,"image")]/@href'</li> <li>2.css(‘a[href*=”image”]::attr(href)’)</li></ul></li> <li>4)一个属性时：xpath(‘div[@id=”quotesearch”’]/`

0 0

java中classpath和path

java中classpath和path

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子曲谱架桌面乐谱架小提琴乐谱网大众乐谱网妳豆子泡豆子观察日记泡豆子观察日记四年级打豆浆豆子泡好还是不泡好观察豆子日记鬼灭之刃弥豆子高清图片鬼灭之刃豆子鬼灭之刃弥豆子豆子粘贴画图片弥豆子高清图豆子生长过程图片简单豆子粘贴画图片泡豆子日记四年级四年级作文泡豆子400字豆乐儿歌桃乐豆乐豆宝盒下载豆乐福豆奶乐豪斯乐豪斯装饰公司乐豪斯装饰公司怎么样青岛乐豪斯装饰公司乐豪斯装饰产业集团包豪斯理查德米尔豪斯尼克松豪斯医生包豪斯风格豪斯医生第八季豪斯医生第一季豪斯包豪斯设计理念戴尔豪斯大学斯腾豪斯福尔豪斯富尔豪斯包豪斯大学魏玛包豪斯大学