BeautifulSoup库的基本使用说明-01
来源:互联网 发布:淘宝达人有什么用 编辑:程序博客网 时间:2024/05/27 14:11
BeautifulSoup文档地址:http://www.crummy.com/software/BeautifulSoup/bs4/doc/
以例子说明BeautifulSoup库的基本使用:
<a href="http://huati.weibo.cn/ht?k=%E6%B2%A1%E8%84%96%E5%AD%90%E7%A5%9E%E5%85%BD&from=rank" class="k">神兽</a>
<a href="http://huati.weibo.cn/ht?k=Balabala&from=rank" class="k">Blabla</a>
2.获取标签名为a并且class="k"的HTML内容(获取全部)
3.获取一个标签的文本值(text)
以例子说明BeautifulSoup库的基本使用:
<a href="http://huati.weibo.cn/ht?k=%E6%B2%A1%E8%84%96%E5%AD%90%E7%A5%9E%E5%85%BD&from=rank" class="k">神兽</a>
<a href="http://huati.weibo.cn/ht?k=Balabala&from=rank" class="k">Blabla</a>
... ...
0.将HTML转换成BeautifulSoup的格式类型
text = urllib2.urlopen(url).read()soupText = BeautifulSoup(text.strip())
1.获取标签名为a并且class="k"的HTML内容(获取单条)
strs=str(soupText.find('a',{'class':'k'})) #查询单个结果返回:<a href="http://huati.weibo.cn/ht?k=%E6%B2%A1%E8%84%96%E5%AD%90%E7%A5%9E%E5%85%BD&from=rank" class="k">神兽</a>
2.获取标签名为a并且class="k"的HTML内容(获取全部)
strs=soupText.findAll(name='a', attrs={'class':'k'}) #查询全部匹配结果for singleRes in strs: print 'No.',i,': ',singleRes.string #依次取出不同匹配内容[注意]返回结果与1.中返回结果类似,但是为全部满足条件的内容
3.获取一个标签的文本值(text)
print 'No.',i,': ',singleRes.string #输出a标签对应的文本值
返回:神兽
[注意]singleRes.text 亦可
4.获取标签的属性值(例如获取"href"对应的内容)
print singleRes['href'] #获取标签a中href对应值返回:http://huati.weibo.cn/ht?k=.......
- BeautifulSoup库的基本使用说明-01
- BeautifulSoup库的基本使用说明-02
- BeautifulSoup库的安装及基本元素
- BeautifulSoup的基本用法
- Python网络爬虫--BeautifulSoup库的基本元素
- BeautifulSoup库的安装
- BeautifulSoup库的使用
- sourceTree的基本使用说明
- (二)BeautifulSoup的基本了解使用
- BeautifulSoup的安装和基本使用方式
- BeautifulSoup和lxml的基本用法示例
- python爬虫系列(2)—— requests和BeautifulSoup库的基本用法
- Python 下的BeautifulSoup 库
- BeautifulSoup库的用法详解
- xmlDocument方法的基本使用说明
- monkey的基本命令使用说明
- Spring mvc 的基本使用说明
- Python BeautifulSoup基本使用
- .asp网页连接数据库设置方法
- Android如何通过content provider构建媒体文件数据库
- 修改eclipse背景、字体颜色.
- HDU 1009
- 如何获得android手机拍照后照片的存放目录
- BeautifulSoup库的基本使用说明-01
- Flex入门指南—PHP开发者
- Install Greenplum Hadoop on VirtualBox 4.2 + centos 6.2
- android---利用反射实现的屏幕录制技术
- Android 开发之多线程处理、Handler 详解
- linux下破解Python集成开发环境WingIDE4.1,以及使用PyCharm的使用
- GPT转MBR分区格式图文教程
- poj 1207 3n+1
- 嵌入式经典笔试题-----不看后悔啊