python乱码解决以及sys编码格式

来源:互联网 发布:淘宝威客平台 编辑:程序博客网 时间:2024/05/22 09:45

1. Python中文乱码解决

① 错误SyntaxError: Non-ASCII character '\xe9' in file

② 解决:加上# -*- coding: utf-8 -*-,代码如下:

# -*- coding: utf-8 -*-
print '中文乱码'

 

2. 修改系统模块(sys)的编码格式

2.1. 方式一:

# -*- coding: utf-8 -*-
#导入系统模块库
import sys
#重新加载系统环境,必须初始化,否则无法设置字符集
reload(sys)
#初始化运行环境为UTF-8,否则姓名中文输出报错
sys.setdefaultencoding('utf-8')
#输出系统编码格式
print sys.getdefaultencoding()

那么为什么要重新加载,而直接引用过来则不能调用该函数呢?

 

因为setdefaultencoding函数在被系统调用后被删除了,所以通过import引用进来时其实已经没有了,

所以必须reload一次sys模块,这样setdefaultencoding才会为可用,才能在代码里修改解释器当前的字符编码。

 

python安装目录的Lib文件夹下,有一个叫site.py的文件,

在里面可以找到main() --> setencoding()-->sys.setdefaultencoding(encoding),

因为这个site.py每次启动python解释器时会自动加载,

所以main函数每次都会被执行,setdefaultencoding函数一出来就已经被删除了

源码如下:


 

2.2. 方式二

① 可以在Python安装目录下的Lib/site-packages目录中,新建一个sitecustomize.py文件(建在这里,每次启动Python的时候设置将自动生效),内容如下:

import sys

sys.setdefaultencoding('utf-8') #set default encoding to utf-8

② 再直接执行以下代码

# -*- coding: utf-8 -*-
#导入系统模块库
import sys
#输出系统编码格式
print sys.getdefaultencoding()

 

 

备注:第二部分修改系统模块的编码格式的一系列设置并不是必需的,只在文件头加上# -*- coding: utf-8 -*-,不对sys进行setdefaultencoding 也不会出现乱码情况,只是为了更加熟悉sys模块。

有什么不对的地方请各位大手子评论指出来,以免误导到其他人


原创粉丝点击