python day3
来源:互联网 发布:淘宝小二是什么意思 编辑:程序博客网 时间:2024/05/29 17:50
网络爬虫第二周
W2.1 Beautiful Soup库安装
使用BeautifulSoup库
from bs4 import BeautifulSoup #BeautifulSoup是一个类soup = BeautifulSoup("html格式的代码","html.parser") #两个参数:一个是要解析的代码;另一个是解析器——BeautifulSoup有四个解析器
上面是从bs4库中引用了一个叫做“BeautifulSoup”的类型。当然也可以直接饮用bs4库
import bs4
认为html文档,标签树和BeautifulSoup类是等价的
也可以用打开文件的方式提供html文档,如下
soup2 = BeautifulSoup(open("D://demo.html"),"html.parser")
BeautifulSoup类有五种基本类型:标签,标签名字,标签属性,标签内字符串和注释
soup.tag #如soup.a 返回标签树中的第一个a标签soup.a.name #获得a的名字soup.a.parent.name #获得a父节点的名字tag = soup.atag.attrs #获得标签的属性(这里获得属性似乎类似数组,老师称其为字典)tag.attrs['class']type() #用于查询类型(md没学过python的我好累tag.string #获得标签的内容 可以跨过多个标签类型,获取第一个碰到的内容(估计是)
遍历有下行、上行和平行遍历。
遍历时会用到一种叫迭代类型的,只能用在循环中,循环语句如下
for pars in soup.title.parents:print(pars)
——prettify()方法,美化html页面,让页面方便阅读
bs4默认utf8编码
0 0
- Day3、Python
- Python-day3
- python -day3
- python day3
- PYTHON---DAY3
- python Day3
- Learning Python Day3
- Python-Day3(高级特性)
- Python学习day3作业
- Python学习,Day3
- python day3(20170222)
- python学习日志--day3
- python 3 day3
- Python笔记Day3
- python自动化 Day3
- DAY3每日Python练习
- python day3 总结
- Python学习Day3
- JAVA学习第二天
- LeetCode 129. Sum Root to Leaf Numbers
- SVN 基本使用
- spinner(下拉列表框),RadioButton(单选按钮),EditText,Adapter的应用
- 求一个int型整数的两种递减数之和(java)--2015华为机试题
- python day3
- 在不申请新内存空间条件下交换两个数的值
- 下载英文文章的一些技巧
- C++11系列-改进的类型推导:auto、decltype和新的函数语法
- hdu 3853 LOOPS(概率dp)
- 关于shiro权限控制java.l ang.Class cannot be cast to java.lang.reflect.ParameterizedType
- java标准输入输出流
- 关于HTML/CSS的排版的备忘录
- 3.16