UnicodeDecodeError解决方案
来源:互联网 发布:java 文件上传过程 编辑:程序博客网 时间:2024/05/19 16:20
在使用tokenizer.tokenize()时候会遇到UnicodeDecodeError的问题,因为默认情况下,Python采用的是ascii编码方式,如下所示:
python -c "import sys; print sys.getdefaultencoding()"ascii
而Python在进行编码方式之间的转换时,会将 unicode 作为“中间编码”,但 unicode 最大只有 128 那么 长,所以这里当尝试将 ascii 编码字符串转换成”中间编码” unicode 时由于超出了其范围,就报出了如上错误。
网上找到以下解决办法:
直接改为tokenizer.tokenize(string.decode(‘utf-8’))
我们将Python的默认编码方式修改为utf-8
import sysdefaultencoding = 'utf-8'if sys.getdefaultencoding() != defaultencoding: reload(sys) sys.setdefaultencoding(defaultencoding)
阅读全文
0 0
- UnicodeDecodeError解决方案
- flask flash UnicodeDecodeError 解决方案
- UnicodeDecodeError
- 对于python中出现UnicodeDecodeError问题的解决方案
- 导入paramiko库时报 UnicodeDecodeError 错误的解决方案
- setuptools,pip,install,UnicodeDecodeError: 'ascii' codec can't decode byte.原因和解决方案
- setuptools,pip,install,UnicodeDecodeError: 'ascii' codec can't decode byte.原因和解决方案
- setuptools,pip,install,UnicodeDecodeError: 'ascii' codec can't decode byte.原因和解决方案
- python 安装scrapy错误提示:UnicodeDecodeError: 'ascii' codec can't decode byte 解决方案
- Python3解决UnicodeDecodeError: 'utf-8' codec can't decode byte..问题 终极解决方案
- 安装 Miniconda时 UnicodeDecodeError: 'ascii' codec can't decode byte.原因和解决方案
- [Python ]UnicodeDecodeError
- Flask UnicodeDecodeError
- Python-UnicodeDecodeError
- UnicodeDecodeError解决办法
- django UnicodeDecodeError
- setuptools 安装PIL等第三方模块出现错误,以及UnicodeDecodeError: 'ascii' codec can't decode byte.原因和解决方案
- python 网络爬虫报错“UnicodeDecodeError: 'utf-8' codec can't decode byte 0x8b in position”解决方案
- android通用适配器的封装
- TCP协议和UDP协议的区别
- SQLServer中把某个表里的记录复制到另一个数据库的表中
- 模拟实现boost库里的智能指针
- kubernetes之Pod详解
- UnicodeDecodeError解决方案
- Bugly Android自动上传符号表
- Android中进程和线程的概念
- Linux 使用 dpkg 安装 Debian 包
- 库存扣多了,到底怎么整
- java中异常和检测类
- sqoop 安装与使用
- Whitelabel Error Page
- P1005矩阵取数