python之find_all

来源:互联网 发布:java中根号怎么表示 编辑:程序博客网 时间:2024/05/16 03:50
#python之find_all#coding:utf8from bs4 import BeautifulSoup#指定要搜索的文档:html_doc="""<li><a href="//www.w3cschool.cn/javascript/" title="Javascript教程">Javascript</a></li><li><a href="//www.w3cschool.cn/jquery/" title="Jquery教程">Jquery</a></li><li><a href="//www.w3cschool.cn/bootstrap/" title="Bootstrap教程">Bootstrap</a></li><li><a href="//www.w3cschool.cn/php/" title="PHP教程">PHP</a></li><li><a href="//www.w3cschool.cn/java/" title="Java教程">Java</a></li><li><a href="//www.w3cschool.cn/python/" title="Python教程">Python</a></li><li><a href="//www.w3cschool.cn/mysql/" title="MySQL教程">MySQL</a></li><li><a href="//www.w3cschool.cn/sql/" title="SQL教程">SQL</a></li><li><a href="//www.w3cschool.cn/json/" title="JSON教程">Json</a></li><!--<li><a href="//www.w3cschool.cn/c/" title="C教程">C</a></li>-->"""#               传入文档     解析器        指定编码:UTF-8soup=BeautifulSoup(html_doc,'html.parser',from_encoding='utf-8')print '获取所有的链接:'links=soup.find_all('a')for link in links:    print link.name,link['href'],link.get_text()#输出是这样:"""获取所有的链接:a //www.w3cschool.cn/javascript/ Javascripta //www.w3cschool.cn/jquery/ Jquerya //www.w3cschool.cn/bootstrap/ Bootstrapa //www.w3cschool.cn/php/ PHPa //www.w3cschool.cn/java/ Javaa //www.w3cschool.cn/python/ Pythona //www.w3cschool.cn/mysql/ MySQLa //www.w3cschool.cn/sql/ SQLa //www.w3cschool.cn/json/ Json"""