python处理json

来源：互联网发布：ld3320语音识别算法编辑：程序博客网时间：2024/06/06 00:52

python处理json

概念：

1.序列化（Serialization）：将对象的状态信息转换为可以存储或可以通过网络传输的过程，传输的格式可以是JSON、XML等。反序列化就是从存储区域（JSON，XML）读取反序列化对象的状态，重新创建该对象。

2.JSON（JavaScript Object Notation）：一种轻量级数据交换格式，相对于XML而言更简单，也易于阅读和编写，机器也方便解析和生成，Json是JavaScript中的一个子集。

3.Python2.6开始加入了JSON模块，无需另外下载，Python的Json模块序列化与反序列化的过程分别是 encoding和 decoding

encoding：把一个Python对象编码转换成Json字符串

decoding：把Json格式字符串解码转换成Python对象

对于简单数据类型（string、unicode、int、float、list、tuple、dict），可以直接处理。

json.dumps方法对简单数据类型encoding:

import jsondata = [{'a':"A",'b':(2,4),'c':3.0}]  #list对象print "DATA:",repr(data)data_string = json.dumps(data)print "JSON:",data_string输出：DATA: [{'a':'A','c':3.0,'b':(2,4)}] #python的dict类型的数据是没有顺序存储的JSON: [{"a":"A","c":3.0,"b":[2,4]}]

json.load方法处理简单数据类型的decoding（解码）转换

import jsondata = [{'a':"A",'b':(2,4),'c':3.0}]  #list对象data_string = json.dumps(data)print "ENCODED:",data_stringdecoded = json.loads(data_string)print "DECODED:",decodedprint "ORIGINAL:",type(data[0]['b'])print "DECODED:",type(decoded[0]['b'])输出:ENCODED: [{"a": "A", "c": 3.0, "b": [2, 4]}]DECODED: [{u'a': u'A', u'c': 3.0, u'b': [2, 4]}]ORIGINAL: <type 'tuple'>DECODED: <type 'list'>

json的人文关怀

import jsondata = [ { 'a':'A', 'b':(2, 4), 'c':3.0 } ]print 'DATA:', repr(data)unsorted = json.dumps(data)print 'JSON:', json.dumps(data)print 'SORT:', json.dumps(data, sort_keys=True)输出:DATA: [{'a': 'A', 'c': 3.0, 'b': (2, 4)}]JSON: [{"a": "A", "c": 3.0, "b": [2, 4]}]SORT: [{"a": "A", "b": [2, 4], "c": 3.0}indent参数根据数据格式缩进显示，读起来更加清晰:import jsondata = [ { 'a':'A', 'b':(2, 4), 'c':3.0 } ]print 'DATA:', repr(data)print 'NORMAL:', json.dumps(data, sort_keys=True)print 'INDENT:', json.dumps(data, sort_keys=True, indent=2)输出:DATA: [{'a': 'A', 'c': 3.0, 'b': (2, 4)}]NORMAL: [{"a": "A", "b": [2, 4], "c": 3.0}]INDENT: [  {    "a": "A",    "b": [      2,      4    ],    "c": 3.0  }]

separators参数的作用是去掉,,:后面的空格，从上面的输出结果都能看到", :"后面都有个空格，这都是为了美化输出结果的作用，但是在我们传输数据的过程中，越精简越好，冗余的东西全部去掉，因此就可以加上separators参数：

import jsondata = [ { 'a':'A', 'b':(2, 4), 'c':3.0 } ]print 'DATA:', repr(data)print 'repr(data)             :', len(repr(data))print 'dumps(data)            :', len(json.dumps(data))print 'dumps(data, indent=2)  :', len(json.dumps(data, indent=2))print 'dumps(data, separators):', len(json.dumps(data, separators=(',',':')))输出：DATA: [{'a': 'A', 'c': 3.0, 'b': (2, 4)}]repr(data)             : 35dumps(data)            : 35dumps(data, indent=2)  : 76dumps(data, separators): 29

skipkeys参数，在encoding过程中，dict对象的key只可以是string对象，如果是其他类型，那么在编码过程中就会抛出ValueError的异常。skipkeys可以跳过那些非string对象当作key的处理.

import jsondata= [ { 'a':'A', 'b':(2, 4), 'c':3.0, ('d',):'D tuple' } ]try:    print json.dumps(data)except (TypeError, ValueError) as err:    print 'ERROR:', errprint print json.dumps(data, skipkeys=True)输出:ERROR: keys must be a string[{"a": "A", "c": 3.0, "b": [2, 4]}]

json格式字符串写入到文件流中

对于大数据，把它编码到一个类文件(file-like)中，load()和dump()方法可以实现。

import jsonimport tempfiledata = [ { 'a':'A', 'b':(2, 4), 'c':3.0 } ]f = tempfile.NamedTemporaryFile(mode='w+')json.dump(data, f)f.flush()print open(f.name, 'r').read()输出：[{"a": "A", "c": 3.0, "b": [2, 4]}]类似的：import jsonimport tempfilef = tempfile.NamedTemporaryFile(mode='w+')f.write('[{"a": "A", "c": 3.0, "b": [2, 4]}]')f.flush()f.seek(0)print json.load(f)输出：[{u'a': u'A', u'c': 3.0, u'b': [2, 4]}]

0 0