Beautiful Soup-学习笔记
来源:互联网 发布:java微信二维码支付 编辑:程序博客网 时间:2024/05/18 09:35
使用CSS选择器
CSS选择器:[http://www.w3school.com.cn/cssref/css_selectors.asp]
Beautiful Soup文档:https://www.crummy.com/software/BeautifulSoup/bs4/doc.zh/
基础用法
html='''<div class="panel"> <div class="panel-heading"> <h4>Hello</h4> </div> <div class="panel-body"> <ul class="list" id="list-1"> <li class="element">Foo</li> <li class="element">Bar</li> <li class="element">Jay</li> </ul> <ul class="list list-small" id="list-2"> <li class="element">Foo</li> <li class="element">Bar</li> </ul> </div></div>'''soup = BeautifulSoup(html, 'lxml')# 查找class=panel 中,class=panel-headingprint(soup.select('.panel .panel-heading')) # 选择class 用 . 查找之间用空格来分隔[<div class="panel-heading"><h4>Hello</h4></div>]# 查找标签ul 中,标签liprint(soup.select('ul li'))[<li class="element">Foo</li>, <li class="element">Bar</li>, <li class="element">Jay</li>, <li class="element">Foo</li>, <li class="element">Bar</li>]# 查找 id = list-2 中 class=elementprint(soup.select('#list-2 .element')) # 选择id 用 # [<li class="element">Foo</li>, <li class="element">Bar</li>]
获取属性
[‘属性名’] 或 .attrs[‘属性名’]
for ul in soup.select('ul'): # 筛选ul,获取list,遍历得到id属性(两种方法) print(ul['id']) print(ul.attrs['id'])list-1list-1list-2list-2
获取内容
get_text() 或 .string
for li in soup.select('li'): print('Get Text:', li.get_text()) print('String:', li.string)Get Text: FooString: FooGet Text: BarString: BarGet Text: JayString: JayGet Text: FooString: FooGet Text: BarString: Bar# 二者的效果是完全一致的
阅读全文
0 0
- Beautiful Soup-学习笔记
- Python的Beautiful Soup学习笔记
- python爬虫-Beautiful Soup学习笔记
- Beautiful Soup学习
- 【python学习笔记】10:Beautiful Soup模块的使用
- webbrowser、requests、Beautiful Soup学习
- Beautiful Soup
- Beautiful Soup
- Beautiful Soup
- Beautiful Soup
- Beautiful Soup
- Beautiful Soup -- 文档笔记(一)
- Beautiful Soup 4.4.0文档学习记录
- 【python学习笔记】8:网页解析器及安装Beautiful Soup 4
- Beautiful Soup 4库--python2.x(学习日记)
- Python爬虫学习二——Beautiful Soup库
- Python语言学习:Beautiful Soup四个对象的具体用法
- Python3爬虫学习3:Beautiful Soup的用法
- leetcode 002 Add Two Numbers
- ubuntu安装laravel/homestead
- Lvs+keepalived实现高可用负载均衡
- docker-netcore-firstapp学习笔记
- 第十一章关联容器
- Beautiful Soup-学习笔记
- POJ 2506--Tiling
- 启用了 Intel VT-x
- CSDN-markdown编辑器语法——字体、字号与颜色
- 归并排序
- 如何使用Android Studio-Androis Studio与Git-Android Studio与Github-Android Studio常用快捷键
- 1-35kotlin
- 浮尘可穿
- Python/Django 生成二维码