python的BeautifulSoup用法

来源:互联网 发布:淘宝开店培训班多少钱 编辑:程序博客网 时间:2024/06/08 14:38


python的BeautifulSoup用法
首先导入模块
from bs4 import BeautifulSoup
soup=BeautifulSoup(opener)

1.tag标签法
soup.head.title
如果是一层层的标签包下去只取每层标签第一个

2.contents法
比如三元素:[u'\n','<html>xxxx</html>',u'\n']
soup.contents   返回列表,不是单一元素
soup.contents[x].contents  是对各列表的取值

3..next法
只对单一元素进行.next,比如
soup.contents[1]=u'HTML'
soup.contents[2]=u'\n'
则soup.content[1].next等价于soup.contents[2]

搜索法
.find('p') 返回字符串
.findall('p') 返回列表

4. .attrs[x]取属性值法
在上述各方法获取标签体之后,通过对标签实施attrs得到一个内部属性列表
在标签后新增.attrs['id']取得该标签内部id的属性值
soup.contents[3].attrs[1]='/'