程序博客网 > 淘宝拍卖房产会可信吗

python2.7 beautifulsoup学习使用

来源：互联网发布：淘宝拍卖房产会可信吗编辑：程序博客网时间：2024/05/22 06:17

学习使用python的beautiful soup库，大大方便了网络爬虫对于HTML文件的解析，beautiful soup将HTML拆解成对象处理，将HTML转换成字典和数组，相比利用正则表达式解析的爬虫，省略了学习正则表达式的高成本

说人话就是正则表达式太难了，博主学不会！

本篇只介绍Beautiful Soup的使用，不涉及安装、配置。

Beautiful Soup的使用方法如下：

1、创建Beautiful Soup对象

首先导入bs4库，创建Beautiful Soup对象

?
1
2
`from bs4 import BeautifulSoup#导入BeautifulSoup模块`
`soup = BeautifulSoup(html.decode("utf-8"))#创建BeautifulSoup对`

2、格式化输出

官方文档实例

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
`from BeautifulSoup import BeautifulSoup`
`import re`

`doc = ['<title>Page title</title>',`
       `'<p id="firstpara" align="center">This is paragraph <b>one</b>.',`
       `'</p><p id="secondpara" align="blah">This is paragraph <b>two</b>.']`
`soup = BeautifulSoup(''.join(doc))`

`print soup.prettify()`
`#   <title>`
`#    Page title`
`#   </title>`
`#   </p><p id="firstpara" align="center">`
`#    This is paragraph`
`#    <b>`
`#     one`
`#    </b>`
`#    .`
`#   </p>`
`#   <p id="secondpara" align="blah">`
`#    This is paragraph`
`#    <b>`
`#     two`
`#    </b>`
`#    .`
`#   </p>`

后面再补充。。。。

0 0

淘宝拍卖房产会可信吗

淘宝拍卖房产会可信吗

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子天降萌妻爱意欢目录如意剑仙意如欢三千娇娃我意纵欢人生的意须纵欢秦意司少琛司婉然司意欢意气风发意气洋洋意气用事意气扬扬书生意气意气相投意气意气自如意气之争意气飞扬意气高昂意气用事什么意思意气风发近义词书生意气的意思谈意气议论文800字暴走大侠意气相投意气相投的意思意气用事的意思意气用事是什么意思意气风发的近义词形容少年意气风发的诗句描写青年人意气风发的诗句意气勤勤恳恳意气风发成语接龙意气风发的意思是什么书生意气挥斥方遒的意思是意气风发是什么意思意气风发的诗句描写少年意气风发的诗句意气风发的意思形容少年意气奋发的诗句少年意气风发的诗句法意瑞游攻略游文意独品西游法意瑞三国游