python 去除html标签函数

来源:互联网 发布:留学新加坡 知乎 编辑:程序博客网 时间:2024/06/13 22:55
def strip_tags(html):
"""
Python中过滤HTML标签的函数
>>> str_text=strip_tags("<font color=red>hello</font>")
>>> print str_text
hello
"""
from HTMLParser import HTMLParser
html = html.strip()
html = html.strip("\n")
result = []
parser = HTMLParser()
parser.handle_data = result.append
parser.feed(html)
parser.close()
return ''.join(result)
0 0
原创粉丝点击