python decode()函数初解

来源:互联网 发布:淘宝公司人员架构 编辑:程序博客网 时间:2024/06/14 23:52

python字符集,没弄懂的菜鸟怕是要耗很长的时间去掌握。

decode()函数能够提供大的帮助。

<pre name="code" class="python">#coding:utf-8d=[]a=[u'一','二','三','四','五','六']b=['我','们','他']c=['的','吗']a=a+b+cprint afor i in a:    print i,    i=i.decode("utf-8")    d.append(i)#因为字符集的关系,在初定的时候没有加字符串,直接print a与print Single_word_set的区别即可见for i in d:    print i,print d

运行结果:

<pre name="code" class="python">[u'\u4e00', '\xe4\xba\x8c', '\xe4\xb8\x89', '\xe5\x9b\x9b', '\xe4\xba\x94', '\xe5\x85\xad', '\xe6\x88\x91', '\xe4\xbb\xac', '\xe4\xbb\x96', '\xe7\x9a\x84', '\xe5\x90\x97']一 二 三 四 五 六 我 们 他 的 吗 一 二 三 四 五 六 我 们 他 的 吗 [u'\u4e00', u'\u4e8c', u'\u4e09', u'\u56db', u'\u4e94', u'\u516d', u'\u6211', u'\u4eec', u'\u4ed6', u'\u7684', u'\u5417']

1.对字符串初赋值时,其前没加u转为unicode编码格式时,为utf-8编码格式,见print a的结果,可分辨其区别。

2.经过decode()函数,解码utf-8(因为第一行定义了utf-8,decode对这utf-8解/转了),转为unicode编码,故print d得出的结果为unicode编码格式。




0 0
原创粉丝点击