BeautifulSoup库的安装及基本元素
来源:互联网 发布:软件业务销售合同范本 编辑:程序博客网 时间:2024/05/21 19:33
一、BeautifulSoup的安装
1.安装beautifu soup
以管理员权限执行cmd,然后执行pip install beautifulsoup4 命令
2.Beautiful Soup库的安装小测
演示HTML页面地址http://python123.io/ws/demo.html
3.BeautifulSoup库解析HTML库
from bs4 import BeautifulSoup
soup=BeautifulSoup(‘<p>data</p>,’html.parser’’)
二、BeautifulSoup库的基本元素
1.Beautiful Soup库的引用
Beautiful Soup库,也叫beautifulsoup4或bs4 如:from bs4 import BeautifulSoup
2.Beautiful Soup解析器
解析器 使用方法 条件
bs4的HTML解析器 BeautifulSoup(mk,’html.parser’) 安装bs4库
lxml的HTML解析器 BeautifulSoup(mk,’lxml’) pip install lxml
lxml的XML解析器 BeautifulSoup(mk,’xml’) pip install lxml
html5lib的解析器 BeautifulSoup(mk,’html5lib’) pip install html5lib
3.Beautiful Soup类的基本元素
基本元素 说明
Tag 标签,最基本的信息组织单元,分别用<>和</>标明开头和结尾
Name 标签的名字,<p>...</p>的名字是’p’,格式是:<tag>.name
Attributes 签的属性,字典形式组织,格式:<tag>.attrs
NavigableString 标签内非属性字符串,<>...</>中字符串,格式:<tag>.string
Comment 标签内字符串的注释部分,一种特殊的Comment类型
- BeautifulSoup库的安装及基本元素
- Python网络爬虫--BeautifulSoup库的基本元素
- beautifulsoup的安装及引入
- BeautifulSoup的安装及介绍
- BeautifulSoup库的安装
- BeautifulSoup的安装和基本使用方式
- BeautifulSoup库的基本使用说明-01
- BeautifulSoup库的基本使用说明-02
- BeautifulSoup的基本用法
- 爬虫的基本概念及BeautifulSoup的基本使用
- Windows安装BeautifulSoup及使用
- Python库beautifulsoup的安装与使用
- BeautifulSoup的安装
- python BeautifulSoup的安装
- BeautifulSoup的安装
- BeautifulSoup的安装
- beautifulsoup 的安装
- BeautifulSoup的安装使用
- 面向对象的六大基本原则
- 参数传递
- CUDA学习之纹理内存
- HDOJ 1272 小希的迷宫 (并查集实现 及 Tarjan实现)
- 数据结构与算法-----排序算法
- BeautifulSoup库的安装及基本元素
- 读取手机联系人,复杂(姓名,电话,邮箱)
- 剑指offer:从上往下打印二叉树
- HDU3829 【最大独立子集】
- Java工程师的一些面试总结(6)
- ArcGis地点名标注处理
- Java中的Filter过滤器
- 前端试题大综合练习(六)
- vim设置及其命令