程序博客网 > 李雪健演技知乎

BeautifulSoup使用的html解析器比较

来源：互联网发布：李雪健演技知乎编辑：程序博客网时间：2024/06/07 15:54

解析器使用方法优势劣势Python标准库BeautifulSoup(markup, "html.parser")

Python的内置标准库
执行速度适中
文档容错能力强

Python 2.7.3或3.2.2前的版本中文档容错能力差

lxml html解析器BeautifulSoup(markup, "lxml")

速度快
文档容错能力强

需要安装C语言库

lxml xml解析器

BeautifulSoup(markup, ["lxml", "xml"])

BeautifulSoup(markup, "xml")

速度快
唯一支持xml的解析器

需要安装C语言库

html5libBeautifulSoup(markup, "html5lib")

最好的容错性
以浏览器的方式解析文档
生成html5格式的文档

速度慢
不依赖外部扩展

0 0

李雪健演技知乎

李雪健演技知乎

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子网线卡线器网线电话联通网线家用网线网线穿线器网线切换器大唐网线 usb转网线修网线网线寻线仪网线英文网线直通网线对接网线类普通网线连接网线网线选择 91国内网线播放网线顺序口诀家庭8根网线接法图解网线水晶头接法顺序笔记本电脑网线 poe供电网线接法六类网线水晶头接法超五类网线能跑千兆吗网线接法顺序网线怎么接水晶头网线多少钱一米蝌蚪网线地址笔记本插网线网线接水晶头网线水晶头接线顺序图片电脑网线怎么插网线连接路由器六类网线水晶头超5类网线能走200兆吗家庭网线接法图解8根网线面板接法图解墙上网线口接法图解步骤网线和电话线网线插座怎么接