scrapy提取不在标签内文字
来源:互联网 发布:汤臣倍健跟安利 知乎 编辑:程序博客网 时间:2024/06/08 16:56
response.xpath(u’//span[./text()=”出版社:”]/following::text()[1]’)
如果text() 中有空格, 感谢 @董成良 提醒, 你可能还需要这么写response.xpath(u’//span[contains(./text(), “出版社:”)]/following::text()[1]’)
或者全匹配:response.xpath(u’//span[.//text()[normalize-space(.)=”出版社:”]]/following::text()[1]’)
弱鸡一枚,拿来引用
作者:足兆叉虫
链接:https://www.zhihu.com/question/38080188/answer/75103879
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
如果用xpath,chrome里有个小技巧。
阅读全文
0 0
- scrapy提取不在标签内文字
- scrapy xpath提取标签
- 提取a标签的链接文字
- scrapy 一次性提取多层嵌套标签的所有文本
- scrapy 一次性提取多层嵌套标签的所有文本
- 关于span标签内文字自动换行
- 关于span标签内文字自动换行
- 前台读取数据库提取html标签内的内…
- Android提取HTML代码内的所有文字内容
- 10-文档头部内标签与活动文字标签
- C#获取网页源代码,去除html标签,提取文字源码
- 让Pre标签内的文字自动换行
- 用php正则获得a标签内的文字
- 解决:xpath取出指定多标签内所有文字text
- xpath取出指定多标签内所有文字text
- scrapy提取wikipedia实践1
- Android中如何提取HTML源码内的所有文字内容
- 文字标签
- Differences between dependencymanagement and dependencies in maven
- HTML教程
- 数据结构上机实践第四周项目1
- vim中修改当前文本的模式类型(vim编辑文件有换行,记事本没有换行)
- 压测长链接过程记录
- scrapy提取不在标签内文字
- SpringMVC日期格式类型转换问题--3种处理方法
- Cloudera Hadoop运维管理与性能调优
- Ubuntu VMwork Station虚拟机清理拖拽产生的额外空间
- CentOS 7 网卡命名修改为eth0格式
- 国庆清北刷题冲刺班 Day7 上午
- nginx大量499分析
- 如何div高度占满全屏(自适应)
- 编译时出现类名.o错误的时候的四种处理情况