解决 python 中读写文件的终极方案 UnicodeDecodeError: 'gbk' codec can't decode byte 0x9d in position 1270: illega
来源:互联网 发布:儿童编程教育 知乎 编辑:程序博客网 时间:2024/05/29 15:56
UnicodeDecodeError: ‘gbk’ codec can’t decode byte 0x9d in position 1270: illegal multibyte sequence
上面是遇到的错误,本来想完成读文件,再写入另一文件的。但是在 fp.read() 时,一直遇到上面的错误,经过各种百度,google, 还有神奇的 stackoverflow 才知道是字符流的问题。
知道问题所在,还是没有解决,又苦苦搜索,终于在 stackoverflow 上找到灵感,可以把 open 的方式变为 二进制,也就是下面代码里的 open(filename,’rb’), 这下好了,至少后面的read() 可以通过。
再之后就产生了以下代码,发现问题的路真心不好走,在此mark 下。
# _*_coding:utf-8_*_import refilename = 'section5'fp = open(filename,'rb')content = fp.read().decode('utf-8')reg = r'<p>(.*?)</p>'#print(content)result = re.findall(reg,content)fp.close()fp = open(filename+'.txt','bw')for r in result: r = r.encode('utf-8') fp.write(r) fp.write('\n'.encode('utf-8'))fp.close()
2 0
- 解决 python 中读写文件的终极方案 UnicodeDecodeError: 'gbk' codec can't decode byte 0x9d in position 1270: illega
- 解决python读写文件时UnicodeDecodeError: ‘gbk’ codec can’t decode byte 0x9d 的错误
- UnicodeDecodeError: 'gbk' codec can't decode byte 0x9d in position 1793: illegal multibyte sequence
- 【python编码】UnicodeDecodeError: 'gbk' codec can't decode byte 0xbf in position X
- 【python】-- 安装 xadmin错误:"UnicodeDecodeError: 'gbk' codec can't decode byte 0xa4 in position 3444"
- python 读取文件时报错UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 205: illegal multib
- python 读取文件时报错UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 205: illegal multib
- python | 读文件编码问题 | UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 34: illegal mu
- python 文件操作 UnicodeDecodeError: 'gbk' codec can't decode byte 0xc3 in position 78: invalid continu
- python 读取文件时报错UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 205: illegal multib
- python 读取文件时报错UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 205: illegal multib
- [Python]解决UnicodeDecodeError: 'ascii' codec can't decode byte 0xe6 in position 0
- Python中遇到"UnicodeDecodeError: ‘gbk’ codec can’t decode bytes in position 0: illegal multibyte
- python UnicodeDecodeError: 'gbk' codec can't decode bytes in position
- python的UnicodeDecodeError: 'utf8' codec can't decode byte 0xxx in position
- UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 1106: illegal multibyte s
- UnicodeDecodeError: 'gbk' codec can't decode byte 0xfd in position 3952: illegal multibyte sequence
- UnicodeDecodeError: 'gbk' codec can't decode byte 0xaf in position 683: illegal multibyte sequence
- NYOJ37回文字符串【LCS】
- 正则表达式30分钟入门教程
- phpcms取编译器内容,设置表的字体样式,用jquery去掉表格自带样式
- 数字比较大小并排序问题
- Android打开各类文件夹(SetDataAndType)
- 解决 python 中读写文件的终极方案 UnicodeDecodeError: 'gbk' codec can't decode byte 0x9d in position 1270: illega
- 简单乘法运算功能的实现
- C语言编程入门——if的用法
- 字典NSDictionary
- 正则表达式30分钟入门教程(续)
- 如何在ABBYY FineReader 12中添加图像
- context:property-placeholder
- GitHub for Windows客户端使用(Eclipse开发环境)
- 《汇编语言》第二版 王爽著 第三章 寄存器(内存访问) 要点