一些新手经常遇到的python编码错误

来源:互联网 发布:手机淘宝6.10.3 编辑:程序博客网 时间:2024/05/22 01:57

在python开发中,一般有三个方面的编码错误:

(1)python程序文件编码

编写的程序本身也存在编码,一般可以在程序的开头加上
“#coding=utf-8”或者“#coding=gbk”,
使程序统一为UTF-8或GBK编码。

(2)python程序运行环境(IDE)编码。

不管是python自带的IDLE或者是PyCharm,使用的IDE本身也会有编码。
所以要清楚地知道自己的IDE所使用的编码。

(3)Python程序读取外部文件,网页的编码。

最容易出现编码问题的情况应该是用python读取外部文件,
网页的时候。首先要确定读取的文件,网页的编码格式,
然后通过decode()和encode()方法来进行编码转换。

decode的作用是将其他编码的字符串转换为Unicode编码。

encode的作用是将Unicode编码转换成其他编码的字符串。