python 普通字符串解码问题
来源:互联网 发布:电脑数据恢复好用吗? 编辑:程序博客网 时间:2024/05/17 23:39
代码:
#! /usr/bin/env python
# -*- coding: utf-8 -*-
s = '中文' # 注意这里的 str 是 str 类型的,而不是 unicode
s.encode('gb18030')
这句代码将 s 重新编码为 gb18030 的格式,即进行 unicode -> str 的转换。因为 s 本身就是 str 类型的,因此
Python 会自动的先将 s 解码为 unicode ,然后再编码成 gb18030。因为解码是python自动进行的,我们没有指明解码方式,python 就会使用 sys.defaultencoding 指明的方式来解码。很多情况下 sys.defaultencoding 是
ANSCII,如果 s 不是这个类型就会出错。拿上面的情况来说,我的 sys.defaultencoding 是 anscii,而 s 的编码方式和文件的编码方式一致,是 utf8 的,所以出错了:
UnicodeDecodeError: 'ascii' codec can't decode byte 0xe4 in position
0: ordinal not in range(128)
对于这种情况,我们有两种方法来改正错误:
一是明确的指示出 s 的编码方式
#! /usr/bin/env python
# -*- coding: utf-8 -*-
s = '中文'
s.decode('utf-8').encode('gb18030')
二是更改 sys.defaultencoding 为文件的编码方式
#! /usr/bin/env python
# -*- coding: utf-8 -*-
import sys
reload(sys) # Python2.5 初始化后会删除 sys.setdefaultencoding 这个方法,我们需要重新载入
sys.setdefaultencoding('utf-8')
str = '中文'
str.encode('gb18030')
- python 普通字符串解码问题
- python解码\'\\u\'字符串
- python 字符串GBK解码
- python解码问题
- python 字符串编码与解码
- Decode string----字符串解码问题
- python中文字符解码问题
- Python的编解码问题
- python中的编码解码问题
- python open() 文件解码问题
- 8.python中字符串的编码和解码问题——decode/encode
- Python字符串的编码和解码
- Python字符串的编码与解码
- java中字符串的编码解码问题
- java中字符串的编码解码问题
- 字符串中文乱码、编解码问题
- 字符串深入学习(编码,解码,乱码问题)
- python2 字符串unicode str编码解码问题
- C#编程入门_方法(函数)_7
- PLSQL查询中文显示乱码(问号)的解决方法
- Android Studio 打包Jar
- sublimerepl 快捷键设置
- Rails 使用七牛
- python 普通字符串解码问题
- luajit 安装cjson
- 初入c++(四)string类和c++中的引用
- Android使用磁盘缓存DiskLruCache
- 分布式高并发下唯一标识snowflake算法
- kaldi timit实例运行全过程
- 程序员,教你如何吸引女生。不是追。追太低级了
- hadoop学习路线
- Tomcat Connector三种运行模式(BIO, NIO, APR)的比较和优化