scrapy提取不在标签内文字

来源:互联网 发布:汤臣倍健跟安利 知乎 编辑:程序博客网 时间:2024/06/08 16:56

response.xpath(u’//span[./text()=”出版社:”]/following::text()[1]’)


如果text() 中有空格, 感谢 @董成良 提醒, 你可能还需要这么写response.xpath(u’//span[contains(./text(), “出版社:”)]/following::text()[1]’)


或者全匹配:response.xpath(u’//span[.//text()[normalize-space(.)=”出版社:”]]/following::text()[1]’)

弱鸡一枚,拿来引用

作者:足兆叉虫
链接:https://www.zhihu.com/question/38080188/answer/75103879
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

如果用xpath,chrome里有个小技巧。

这里写图片描述