python 中文编码问题
来源:互联网 发布:mac 音频剪辑合成软件 编辑:程序博客网 时间:2024/09/21 08:59
在用Python 做一应用时,需要将预处理时需要统一编码, 在将utf8转换为gb2312 时报错:
搜索后发现gb2312对一些很生僻的中文字并不支持,比如 “囧” “苶”
然后自己写了几行代码来验证是否真的不支持:
#coding:utf-8
s=u"囧"
b=u"我"
print b.encode("gb2312")
print s.encode("gb2312")
输出:
我
Traceback (most recent call last):
File "test.py", line 6, in
print s.encode("gb2312")
UnicodeEncodeError: 'gb2312' codec can't encode character u'\u56e7'in position 0: illegal multibyte sequence
可以看到“我”被正确解码,而“囧”字解码时却出现了UnicodeEncodeError,果然够囧的…
解决方法:
将gb2312替换为GBK或者GB18030就好了
- python 中文编码 问题
- Python 中文编码问题
- Python 中文 编码问题
- python中文编码问题
- python 中文编码问题
- python中文编码问题
- python 中文编码问题
- python中文编码问题
- python中文编码问题
- python中文编码问题
- python中文编码问题
- python中文编码问题
- Python中文编码问题
- python中文编码问题
- Python中文编码问题
- python 中文编码问题
- Python中文编码问题
- Python中文编码问题
- windows下类似linux编译环境搭建
- 8个可让 Apple TV 赢得机顶盒市场的应用
- 代码设计规范
- Word2010中怎样压缩图片使文件变小
- poj 2400 Supervisor, Supervisee
- python 中文编码问题
- Java Design Model
- C#全角和半角转换
- 排序算法之直接插入排序
- 关于android的Adapter出错的探究
- linux下动态库与静态库实例
- Uva 10090 Marbles 扩展欧几里得 费用最小
- 如何发布自己的Android应用
- StringUtils.isBlank()函数(转载)