HTML解析之三:安装BeautifulSoup4

来源:互联网 发布:地震法术数据 编辑:程序博客网 时间:2024/06/06 04:27
Beautiful Soup是一个可以从HTML或XML文件提取数据的python库能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式在爬虫中主要用到Beautiful Soup的查找提取功能推荐使用Beautiful Soup4安装Beautiful Soup4一:ubuntu或Debain可以执行  apt-get-install Python-bs4二:通过命令安装:easy_install beautifulsoup4或者pip install beautiful4三:下载源码:https://pypi.python.org/pypi/beautifulsoup4/     安装命令:python setup.py installBeautiful支持python标准库中的HTML解析器,还lxml。lxml解析速度比HTML解析器速度快安装lxmlapt-get install Python-lxmleasy_install lxmlpip install lxmlhtml5lib的解析方式与浏览器相同安装html5libapt-get install Python-html5libeasy_install html5libpip install html5lib
原创粉丝点击