程序博客网 > 魔兽盒子mac版

scrapy 一次性提取多层嵌套标签的所有文本

来源：互联网发布：魔兽盒子mac版编辑：程序博客网时间：2024/05/22 06:55

怎样才能一次性提取多层嵌套标签的所有文本，而不是通过循环判断来进行拼接呢。详细如下：

假如页面如下：

<p id='test'>hello<b>world!</b></p>

我要的提取结果是：helloworld!

这里就需要注意text()的使用了：

首先设置sel = Selector(text=doc, type='html')

#如果text()前面使用一个反斜杠：sel.xpath("//p[@id='test']/text()").extract()

得到的结果是：[u'hello']

#如果text()前面使用两个反斜杠：sel.xpath("//p[@id='test']//text()").extract()

这样提取出来的是一个列表，得到的结果是：[u'hello', u'world!']

然后再将列表循环拼接即可得到想要的结果：helloworld!。

转自：http://www.cnblogs.com/qlshine/p/5926101.html

阅读全文

0 0

魔兽盒子mac版

魔兽盒子mac版

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子电脑磁盘性能低怎么办静态ip设置错误怎么办中了远程木马怎么办 ios11软件闪退怎么办战地1ping高怎么办战地1商店打不开怎么办 xp电脑字体乱码怎么办电脑文件删不了怎么办 7z压缩文件损坏怎么办战地4存档损坏怎么办战地1游戏打不开怎么办战机被导弹锁定怎么办眼镜把坏了怎么办眼镜柄断了怎么办眼镜旋转断了怎么办瞄准镜进水了怎么办看电焊眼睛疼怎么办眼镜压变形了怎么办瞄准镜抗震差怎么办眼镜片擦不干净怎么办镜片上有划痕怎么办眼镜片上有划痕怎么办天际线地价过低怎么办不锈钢焊点发黑怎么办袜子老是往下掉怎么办戒指不圆了怎么办 catia打孔不对齐怎么办膨胀螺丝松了怎么办牙齿受外力松动怎么办铁锅铆钉坏了怎么办牛仔裤铆钉坏了怎么办铆钉鞋子磨脚怎么办铆钉长的部分怎么办柳钉没有柳钉枪怎么办? 怀孕吃了螺丝怎么办包包螺丝掉了怎么办螺纹铁叶子发黄怎么办螺丝滑扣了怎么办车牌螺丝没拧紧怎么办小螺丝滑牙怎么办螺丝帽拧圆了怎么办