Beautifulsoup 使用笔记
来源:互联网 发布:vs 编程入门视频教程 编辑:程序博客网 时间:2024/06/06 02:06
1.在线文档 http://www.crummy.com/software/BeautifulSoup/bs4/doc/
2.常用方法
- 选择器 find_all(name, attrs, recursive, text, limit, **kwargs)
3.主要调用方法
4.完整代码
#-*- coding:utf-8 -*-from bs4 import BeautifulSoup;def main():html = """<html><head><title>The Dormouse's story</title></head> <p class="title"><b>The Dormouse's story</b></p> <p class="story">Once upon a time there were three little sisters; and their names were<a href="http://example.com/elsie" class="sister" id="link1">Elsie</a>,<a href="http://example.com/lacie" class="sister" id="link2">Lacie</a> and<a href="http://example.com/tillie" class="cla" id="link3">Tillie</a>;and they lived at the bottom of a well.</p> <p class="story">...</p>"""# print html_doc soup = BeautifulSoup(html)print soup.get_text()#获得文本print soup.find_all('title') #获取标题 print soup.find_all('a')#获取链接<a>print soup.find_all(id="link2")#根据ID来获取HTML元素 print soup.find_all("a",class_="cla") #根据class来获取HTML元素#根据class属性来选择print soup.find_all("a", class_="sister")print soup.select("p.title")#多重属性来选择print soup.find_all("a", attrs={"class": "sister"})#根据文本来选择print soup.find_all(text="Elsie")print soup.find_all(text=["Tillie", "Elsie", "Lacie"])#限制查询的个数print soup.find_all("a", limit=2) if __name__ == '__main__':main()
0 0
- Beautifulsoup 使用笔记
- BeautifulSoup使用笔记
- BeautifulSoup的使用学习笔记
- BeautifulSoup笔记
- BeautifulSoup笔记
- 使用beautifulsoup
- BeautifulSoup使用
- BeautifulSoup使用
- BeautifulSoup使用
- BeautifulSoup应用笔记
- BeautifulSoup学习笔记
- Python BeautifulSoup 简单笔记
- BeautifulSoup学习笔记
- Python BeautifulSoup 简单笔记
- Python BeautifulSoup 简单笔记
- BeautifulSoup的详细笔记
- BeautifulSoup学习笔记
- python BeautifulSoup 库 笔记
- jndi+SPI和API
- 网络流模板
- [GO]Golang 解析xml 生成json 传到前台
- Uber,一个打车软件怎么会有粉丝呢?
- Android壹路听车载环境音乐项目
- Beautifulsoup 使用笔记
- centos自动备份文件夹
- 安卓学习历程(1)
- ubuntu 使用eclipse连接锤子手机做开发
- VC++中,CString,in,char,等数据类型的相互转化
- .Net Windows服务程序中获取安装程序所在目录
- 数据分析FineReport优化报表取数
- Piwik学习 -- 插件开发
- R语言基本备忘-统计分析