python2 读取文件TXT编码问题

来源:互联网 发布:ubuntu vmdk安装 编辑:程序博客网 时间:2024/05/22 07:01

读取文件:

open("test.txt","r")
文件建议另存为UTF-8格式,

字打印出来是“u'\u6c49'” “就是unicode编码(python里面报的ASCII);

”\xe6\xb1\x89“ 是utf-8 编码,printf 输出就是正常汉字了,若还是打印这个,就需要将LIST里for循环打印

utf-8编码的汉字len(),单个字符长度是3;unicode len()长度是1,

将utf-8 的字,.decode("utf-8") 后就是unicode(ascii),ascii编码的  .encode("utf-8”)  后就是utf-8编码的了


虽然python网上的代码多,但是汉字编码做的不如python3好。别的介绍汉字编码的很多,感觉用好encode decode len() 就足够了


阅读全文
0 0
原创粉丝点击