python中json.dumps使用及字符编码
来源:互联网 发布:淘宝子账号登陆不了 编辑:程序博客网 时间:2024/06/06 09:56
我们知道,python中的字符串分普通字符串和unicode字符串,一般从数据库中读取的字符串会自动被转换为unicode字符串
下面回到重点,使用json.dumps时,一般的用法为:
>>> obj={"name":"测试"}
>>> json.dumps(obj)
'{"name": "\\u6d4b\\u8bd5"}'
>>> print json.dumps(obj)
{"name": "\u6d4b\u8bd5"}
>>> json.dumps(obj).encode("utf-8")
'{"name": "\\u6d4b\\u8bd5"}'
可以看到这里输出的字符串为普通字符串,但是里面的内容却是unicode字符串的内容,即使对结果进行encode("utf-8") ,因为这个字符串本身就已经编码过了,所有进行encode不会有变化
要想得到字符串的真实表示,需要用到参数ensure_ascii=False(默认为True):
>>> json.dumps(obj,ensure_ascii=False)
'{"name": "\xe6\xb5\x8b\xe8\xaf\x95"}'
>>> print json.dumps(obj,ensure_ascii=False)
{"name": "测试"}
坑:试试下面的用法(比如key是从数据库中读取的,则会以unicode字符串形式存在):
>>> key=u"name"
>>> obj={key:"测试"}
>>> json.dumps(obj,ensure_ascii=False)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "/usr/lib64/python2.6/json/__init__.py", line 237, in dumps
**kw).encode(obj)
File "/usr/lib64/python2.6/json/encoder.py", line 368, in encode
return ''.join(chunks)
UnicodeDecodeError: 'ascii' codec can't decode byte 0xe6 in position 1: ordinal not in range(128)
这是因为key和value不能以混合普通字符串和unicode字符串的形式存在
改成下面则正常了(同时为普通字符串或同时为unicode字符串):
>>> key=u"name"
>>> obj={key:u"测试"}
>>> json.dumps(obj,ensure_ascii=False)
u'{"name": "\u6d4b\u8bd5"}'
>>> obj={key.encode("utf-8"):u"测试".encode("utf-8")}
>>> json.dumps(obj,ensure_ascii=False)
'{"name": "\xe6\xb5\x8b\xe8\xaf\x95"}'
另外说说还有一个参数default
考虑下面的场景:
>>> class Data:
... def __init__(self):
... self.name = ""
... self.detail = ""
...
>>> data=Data()
>>> data.name="名字"
>>> data.detail="细节"
>>> obj={"data":data}
>>> json.dumps(obj,ensure_ascii=False)
会报下面的异常:
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "/usr/lib64/python2.6/json/__init__.py", line 237, in dumps
**kw).encode(obj)
File "/usr/lib64/python2.6/json/encoder.py", line 367, in encode
chunks = list(self.iterencode(o))
File "/usr/lib64/python2.6/json/encoder.py", line 309, in _iterencode
for chunk in self._iterencode_dict(o, markers):
File "/usr/lib64/python2.6/json/encoder.py", line 275, in _iterencode_dict
for chunk in self._iterencode(value, markers):
File "/usr/lib64/python2.6/json/encoder.py", line 317, in _iterencode
for chunk in self._iterencode_default(o, markers):
File "/usr/lib64/python2.6/json/encoder.py", line 323, in _iterencode_default
newobj = self.default(o)
File "/usr/lib64/python2.6/json/encoder.py", line 344, in default
raise TypeError(repr(o) + " is not JSON serializable")
TypeError: <__main__.Data instance at 0x11e87e8> is not JSON serializable
这是因为json.dumps不知道如何对Data对象进行序列化,需要定义一个函数,并赋给参数default:
>>> def convert_to_builtin_type(obj):
... d = {}
... d.update(obj.__dict__)
... return d
...
>>> json.dumps(obj,ensure_ascii=False, default=convert_to_builtin_type)
'{"data": {"name": "\xe5\x90\x8d\xe5\xad\x97", "detail": "\xe7\xbb\x86\xe8\x8a\x82"}}'
>>> print json.dumps(obj,ensure_ascii=False, default=convert_to_builtin_type)
{"data": {"name": "名字", "detail": "细节"}}
def convert_to_builtin_type(obj):
d = {}
d.update(obj.__dict__)
return d
- python中json.dumps使用及字符编码
- python中json.dumps
- python json.dumps 中文编码
- python中json.dumps打印出u字符
- python json.dumps 中文编码问题
- python json.dumps处理中文字符
- python中json.dumps()/loads()/dump()/load()使用
- python json loads dumps
- Python json.dumps
- Python json dumps() && loads()
- python: json.dumps()中的参数,数据编码格式转换
- 用python里的json.dumps转换编码
- python 匹配非英文字符 json.dumps函数原理
- Python日常:json.loads&json.dumps的使用
- Python下调用json.dumps中文显示问题及解决办法
- python中json/simplejson 序列化/dumps 自定义类型
- [Python]json dumps中文问题
- python生成json(dump/dumps)
- Combination Sum
- JAVA程序在eclipse下可运行但不能在cmd命令下运行的原因
- Java Android客户端开发
- Ruby知识积累2
- Codeforces Round #254 (Div. 2):A. DZY Loves Chessboard
- python中json.dumps使用及字符编码
- Win7服务对照表
- Codeforces Round #246 (Div. 2):A. Choosing Teams
- 風雷益
- 设置启动MyEclipse8.5的时候选择工作空间
- Ubuntu命令行下安装、卸载、管理软件包的方法
- Codeforces Round #246 (Div. 2):B. Football Kit
- 就这样CSDN账号被人盗了??
- zedboard的demo评测