python 中文编码问题

来源：互联网发布：mac 音频剪辑合成软件编辑：程序博客网时间：2024/09/21 08:59

在用Python 做一应用时，需要将预处理时需要统一编码，在将utf8转换为gb2312 时报错：

错误原因:'gb2312' codec can't encode characteru'\xb7' in position 8061: illegal multibyte sequence

搜索后发现gb2312对一些很生僻的中文字并不支持，比如 “囧” “苶”
然后自己写了几行代码来验证是否真的不支持：

#coding:utf-8 s=u"囧" b=u"我" print b.encode("gb2312") print s.encode("gb2312")

输出：

我 Traceback (most recent call last): File "test.py", line 6, in print s.encode("gb2312") UnicodeEncodeError: 'gb2312' codec can't encode character u'\u56e7'in position 0: illegal multibyte sequence

可以看到“我”被正确解码，而“囧”字解码时却出现了UnicodeEncodeError,果然够囧的…

解决方法：
将gb2312替换为GBK或者GB18030就好了

python 中文编码问题
Python 中文编码问题
Python 中文编码问题
python中文编码问题
python 中文编码问题
python中文编码问题
python 中文编码问题
python中文编码问题
python中文编码问题
python中文编码问题
python中文编码问题
python中文编码问题
Python中文编码问题
python中文编码问题
Python中文编码问题
python 中文编码问题
Python中文编码问题
Python中文编码问题
windows下类似linux编译环境搭建
8个可让 Apple TV 赢得机顶盒市场的应用
代码设计规范
Word2010中怎样压缩图片使文件变小
poj 2400 Supervisor, Supervisee
python 中文编码问题
Java Design Model
C#全角和半角转换
排序算法之直接插入排序
关于android的Adapter出错的探究
linux下动态库与静态库实例
Uva 10090 Marbles 扩展欧几里得费用最小
如何发布自己的Android应用
StringUtils.isBlank()函数（转载）