python 编码
来源:互联网 发布:配音用什么软件 编辑:程序博客网 时间:2024/09/21 09:04
json.dumps在默认情况下,对于非ascii字符生成的是相对应的字符编码,而非原始字符,例如:
>>> import json
>>> js = json.loads('{"haha": "哈哈"}')
>>> print json.dumps(js)
{"haha": "\u54c8\u54c8"}
解决办法很简单:
>>> print json.dumps(js, ensure_ascii=False)
{"haha": "哈哈"}
===>#code:utf-8
采集后的数据都带有'<>'html标签:
<img src="http://i4.hdfimg.com/www/images/giftrans/3d/da/7b/18414.gif" border="0"/><span class='WmoJPQM2AzpQMA'>科研<span class='WmoJPQM2AzhQMQ'>最早和<span class='WmoJPQM2AzxQNw'>一项<span class='WmoJPQM2AzdQOA'>教学为一体的现代化<span class='WmoJPQM2AzhQOA'>综合<span class='WmoJPQM2AzhQMQ'>师从性省级医院
在这里只要将所有带<>去除即可:
dr = re.compile(r'<[^>]+>',re.S)
dd = dr.sub('',Html)
完整的python脚本:
第一个函数:将一个字段中的刮号去除
第二个函数:将html中的所有标签去除
0 0
- 系统编码 python编码
- 【编码】Python编码
- PYTHON 编码
- python 编码
- python 编码
- python 编码
- python 编码
- Python 编码
- python编码
- python 编码
- Python编码
- python编码
- python 编码
- python编码
- python 编码
- python编码
- python 编码
- python编码
- 最全Pycharm教程(13)——Pycharm部署
- 使用内部类写工厂方法
- loadrunner自带web订票系统脚本录制之设置关联
- C#中Virtual与override分别有什么用途
- 为什么说设备的引用计数为0时,系统会自动调用它的release函数
- python 编码
- JSON序列化与反序列化一个字典
- Android中通知栏Notification详解以及自定义Notification
- 安装pod
- QT 系统托盘图标
- 大话java中的字符串String使用中十大热点问题
- 一些导航菜单样式设置的方法
- 在debian stretch上编译安装ibus-libpinyin(V1.7.3)过程记录
- Create account 892000 for 2015/12/10 as a cost element in controlling area 1800 Message no. KI280