python2处理中文字符问题

来源:互联网 发布:戴着镣铐的舞蹈 知乎 编辑:程序博客网 时间:2024/05/29 14:00

python2.X下的中文处理,默认有不少问题,例如:

 

上面1个汉字被分成3个表示,这给不是我们想要的效果。


解决方案:

第一种:使用uniout

首先,pip方式来进行安装:

sudo pip install uniout
然后进行测试,确认是否可用:


执行结果:



第二种方法:使用decode('utf-8')

测试代码:


执行结果:


OK!顺利解决!!


总结:python2中,list若包含中文,整体输出时是以十六进制输出的;即使python2中单独使用for来单独输出也不行,但是python3中是默认解决掉该问题的。