Python文件的编码注释 utf-8

来源:互联网 发布:阿里云app备案 编辑:程序博客网 时间:2024/05/01 00:39
如果要在python2的py文件里面写中文,则必须要添加一行声明文件编码的注释,否则python2会默认使用ASCII编码。

[python] view plain copy
  1. # -*- coding:utf-8 -*-  

问题就来了,为什么要如此声明?

首先请参考Python的PEP http://www.python.org/dev/peps/pep-0263/

概要如下

1.必须将编码注释放在第一行或者第二行

2.可选格式有

[python] view plain copy
  1. # coding=<encoding name>  

[python] view plain copy
  1. #!/usr/bin/python  
  2. # -*- coding: <encoding name> -*-  

[python] view plain copy
  1. #!/usr/bin/python  
  2. # vim: set fileencoding=<encoding name> :  

但是再往下看,发现其实只要注释里面有coding 和对应的编码就可以了,例如

[python] view plain copy
  1. #!/usr/bin/python  
  2. # vim: set fileencoding=<encoding name> :  

所以搞了半天对最标准的做法也有点糊涂了。

后来想了想,看了下VIM中对python的语法高亮文件,里面把如下的正则表达式确定为编码声明

[plain] view plain copy
  1. \%^.*\n.\?#.*coding[:=]\s*[0-9A-Za-z-_.]\+.*$  

对于这个正则有些有点看不懂,但是大致如下必须有coding:[编码]或者coding=[编码]才行,这个应该可以视作为标准的声明方式吧。

但是为什么通常这种方式呢?

[python] view plain copy
  1. # -*- coding:utf-8 -*-  

答案在PEP-0263里面有所提及,那就是Emacs等编辑器使用这种方式进行编码声明。

话说PEP里面很多东西都是很值得参考的毕竟可以知道为什么程序这样设计。


相关参考

PEP-0263

http://www.python.org/dev/peps/pep-0263/

vim语法文件编写总结

http://www.cnblogs.com/kohpoll/archive/2012/08/04/2623483.html

# -*- coding: UTF-8 -*- 这是个注释吗?

http://bbs.chinaunix.NET/thread-590066-1-1.html

0 0
原创粉丝点击