python编码笔记

来源:互联网 发布:德阳儿童学编程 编辑:程序博客网 时间:2024/05/29 17:22

python的编码问题是一个非常恼人的问题

中国制定了GB2312编码

Python中运用Unicode,常在字符串前加u’…’

若有UnicodeDecodeEorror(py文件保存的格式有问题)可以在第一行加注释:#--coding:utf-8-- 告诉python解释器,用utf-8编码读取源代码,且将文件用utf-8格式保存

decode的作用是将其他编码的字符串转换成unicode编码,如str1.decode(‘gb2312’),表示将gb2312编码的字符串str1转换成unicode编码。

encode的作用是将unicode编码转换成其他编码的字符串,如str2.encode(‘gb2312’),表示将unicode编码的字符串str2转换成gb2312编码。

python中文编码涉及到 : 文件保存的格式, python解释器是以何种编码解读源代码的 encode() decode()的调用 中文字符串前加不加u(代表着unicode)

1,a = unicode.encode(u’中文’, ‘utf-8’) 中文Unicode占两个字节 中文utf-8 占三个字节
f.write(a)
f.read()输出来为

2,codecs.open(fname, mode, encode,errors,buffering)
创建编码格式为 encode 的文件
尝试用f.read() 输出看看

0 0
原创粉丝点击