python汉字编码的问题

来源:互联网 发布:怎么签署淘宝空间协议 编辑:程序博客网 时间:2024/05/22 10:27
在Idle坏境上测试
>>> a='我们'
>>> a
'\xce\xd2\xc3\xc7'


可以发现是gbk编码
>>> import sys
>>> sys.getdefaultencoding()
'ascii'


发现默认的运行环境是ascii


>>> a.decode('gbk')
u'\u6211\u4eec'


转成unicode编码
>>> a.decode('gbk').encode('utf8')
'\xe6\x88\x91\xe4\xbb\xac'
转成utf8编码


>>> h=u'我们'
>>> h
u'\u6211\u4eec'
>>> 
直接声明unicode编码




unicode编码是\u开头
utf8和gbk是\x开头
但是utf8占用三个字节,gbk占两个字节
0 0
原创粉丝点击