python处理HTML转义字符
来源:互联网 发布:php 编译 mysqli 编辑:程序博客网 时间:2024/05/01 12:28
抓网页数据经常遇到例如>或者 这种HTML转义符,抓到字符串里很是烦人。
比方说一个从网页中抓到的字符串
html = '<abc>'
用Python可以这样处理:
import HTMLParserhtml_parser = HTMLParser.HTMLParser()txt = html_parser.unescape(html) #这样就得到了txt = '<abc>'
如果还想转回去,可以这样:
import cgihtml = cgi.escape(txt) # 这样又回到了 html = '<abc>'
来回转的功能还分了两个模块实现,挺奇怪。没找到更优美的方法,欢迎补充哈~
0 0
- Python处理HTML转义字符
- Python处理HTML转义字符
- python 处理HTML转义字符
- python处理HTML转义字符
- python处理html中的转义字符
- 用Python处理HTML转义字符的5种方式
- java 处理html转义字符' ·
- Python unicode转义字符\u的处理
- Python unicode转义字符\u的处理
- HTML中转义字符如何处理,常见的转义字符有哪些?
- HTML中的转义字符
- HTML转义字符
- HTML & XML 转义字符
- HTML & XML 转义字符
- HTML转义字符
- HTML转义字符
- HTML中的转义字符
- HTML中的转义字符
- RHEL 6 和 RHEL 7 之间的变化(部分内容)
- MyEclipse 7.0 下载
- SAP几则常用的BASIS技巧整理
- Android中UI线程与后台线程交互设计的5种方法
- 关于iOS的多线程处理方式
- python处理HTML转义字符
- 正则表达式案例
- MyEclipse + Tomcat项目重命名
- 两个超长正整数的加法
- <context:annotation-config /> 与<context:component-scan />
- 网站权重提高技巧
- Java反射中Method类invoke方法的用法
- DirectX3D游戏开发一 第一个DirectX3D项目
- Jcrop(头像裁剪工具)