BeautifulSoup处理html
来源:互联网 发布:大数据时代的利弊 编辑:程序博客网 时间:2024/06/05 06:04
这是一个python库,用来处理html之类的文本内容
官网http://www.crummy.com/software/BeautifulSoup/#Download
这个是中文文档
http://zm6.sm-img2.com/?src=http%3A%2F%2Fwww.crummy.com%2Fsoftware%2FBeautifulSoup%2Fbs3%2Fdocumentation.zh.html&uid=51558658fb275070cd84ef8a462ae6b9&hid=&restype=1&from=derive&depth=2&link_type=60&query=&uc_param_str=
这是4的版本的英文文档
http://zm6.sm-img2.com/?src=http%3A%2F%2Fwww.crummy.com%2Fsoftware%2FBeautifulSoup%2Fdocumentation.html&uid=51558658fb275070cd84ef8a462ae6b9&hid=&restype=1&from=derive&depth=3&link_type=60&uc_param_str=&query=beautifulsoup
它有两个版本。一个是BeautifulSoup,另外一个是BeautifulSoup4
安装方法官网都有。
下面是BeautifulSoup的版本,不好用
from BeautifulSoup import BeautifulSoupsoup=BeautifulSoup(html)len(soup)<del>soup.contents[0].text</del>
html里面的文本,相当于innerText是用text来表示。
原版的不太好用,还是bs4版本比较好用。
from bs4 import BeautifulSoupmarkup = '<a href="http://example.com/">\nI linked to <i>example.com</i>\n</a>'soup = BeautifulSoup(markup)print soup.get_text()
0 0
- BeautifulSoup处理html
- Python处理HTML利器——BeautifulSoup
- BeautifulSoup解析HTML(一)
- 用BeautifulSoup分析html
- 【Python】 html解析BeautifulSoup
- 如何从word开始处理html文件?以及windows上安装python lxml beautifulsoup
- python解析html之BeautifulSoup
- 用BeautifulSoup解析html表格
- 使用BeautifulSoup解析html入门
- Python 用BeautifulSoup 解析Html
- 《python进行自然语言处理》练习处理HTML内容的时候出现ImportError: No module named BeautifulSoup错误
- 用BeautifulSoup解析Html格式的Json字符串(处理新浪微博解析不到关注情况)
- 用python的BeautifulSoup分析html
- 用Python解析HTML,BeautifulSoup使用简介
- 用python的BeautifulSoup分析html
- 使用BeautifulSoup解析HTML和XML
- 采用beautifulsoup库 解析html页面
- [学习]用python的BeautifulSoup分析html
- 房建工程知识:全站仪电池的使用
- 将View放在窗口最上面
- cocos2d-x 关于热更新的文章
- xUtils 源码解析
- oracle函数的创建和调用
- BeautifulSoup处理html
- QString和QByteArray的区别
- 程序算法艺术与实践:递归策略基本的思想
- codeforces 219C C. Color Stripe(dp)
- IOS开发+(void)load与+(void)initialize区别
- txt转换pdf格式的转换步骤详解
- sleep、yield、wait知识点
- 麦克风阵列之声源定位
- 充电宝地铁自燃引安全担忧