学习爬虫:Non-ASCII character '\xe8' in file
来源:互联网 发布:文员和淘宝美工哪个好 编辑:程序博客网 时间:2024/06/18 07:48
学习爬虫时遇到的问题
源代码如下
import cookielib
import urllib2
filename = 'cookie.txt'
cookie = cookielib.MozillaCookieJar(filename)
handler = urllib2.HTTPCookieProcessor(cookie)
opener = urllib2.build_opener(handler)
response = opener.open("http://www.baidu.com")
cookie.save(ignore_discard=True, ignore_expires=True)
错误代码:
SyntaxError: Non-ASCII character '\xe8' in file
解决方法
#encoding:utf-8
import cookielib
import urllib2
filename = 'cookie.txt'
cookie = cookielib.MozillaCookieJar(filename)
handler = urllib2.HTTPCookieProcessor(cookie)
opener = urllib2.build_opener(handler)
response = opener.open("http://www.baidu.com")
cookie.save(ignore_discard=True, ignore_expires=True)
Python内部的字符串一般都是 Unicode编码。代码中字符串的默认编码与代码文件本身的编码是一致的。所以要做一些编码转换通常是要以Unicode作为中间编码进行转换的,先将其他编码的字符串解码(decode)成 Unicode,再从 Unicode编码(encode)成另一种编码。
- decode 的作用是将其他编码的字符串转换成Unicode编码,比如:name.decode(“GB2312”),表示将GB2312编码的字符串name转换成Unicode编码
- encode 的作用是将Unicode编码转换成其他编码的字符串,比如:name.encode(”GB2312“),表示将GB2312编码的字符串name转换成GB2312编码
所以在进行编码转换的时候必须先知道 name 是那种编码,然后 decode 成 Unicode 编码,最后载 encode 成需要编码的编码。当然了,如果 name 已经就是 Unicode 编码了,那么就不需要进行 decode 进行解码转换了,直接用 encode 就可以编码成你所需要的编码。对 Unicode 进行编码和对 str 进行编码都是错误的。
- 学习爬虫:Non-ASCII character '\xe8' in file
- Non-ASCII character '\xe8' in file
- SyntaxError: Non-ASCII character '\xe8' in file
- SyntaxError- Non-ASCII character '-xe8' in file
- SyntaxError: Non-ASCII character '\xe8' in file
- python 中文报错 Non-ASCII character '\xe8' in file
- python SyntaxError: Non-ASCII character '\xe8' in file
- Phthon出现SyntaxError: Non-ASCII character '\xe8' in file
- Python_SyntaxError: Non-ASCII character '\xe8' in file错误的解决办法
- File "xxx.py", line 8 SyntaxError: Non-ASCII character '\xe8' in file xxx.py
- Python中文问题 或 SyntaxError: Non-ASCII character '\xe8' in file
- SyntaxError: Non-ASCII character '\xe8' in file,but no encoding decleared
- Non-ASCII character '\xe8' in file xxx.py on line 8, but no encoding declared
- Python保存时提示“SyntaxError: Non-ASCII character '\xe8' in file”
- Python保存时提示“SyntaxError: Non-ASCII character '\xe8' in file”
- python SyntaxError: Non-ASCII character '\xe8' in file (2013-04-13 21:53:14)
- python执行报错:SyntaxError: Non-ASCII character '\xe8' in file .
- SyntaxError: Non-ASCII character '\xe8' in file model.py on line 300, but no encoding declared; 报错
- 控制器数据逆传(代理设计模式解析)
- for
- iOS沙盒路径的查看和使用
- PHP定义常量
- 第二届北京林业大学“计蒜客”杯程序设计竞赛 C题 Candy
- 学习爬虫:Non-ASCII character '\xe8' in file
- Oracle对象之表和索引的介绍
- Windows 10 和 Fedora 23 双系统安装问题集
- 什么是PHP?
- C++(学习笔记)——VS2015静态编译libcurl
- PHP常用函数
- Spring整合ActiveMQ
- Java设计模式——享元模式
- android百度地图开发之定位