python 编码问题

来源:互联网 发布:mac怎么连蓝牙耳机 编辑:程序博客网 时间:2024/06/10 17:10

详解 python 中文编码与处理

源代码文件中,如果有用到非ASCII字符,则需要在文件头部进行字符编码的声明
# -- coding: utf-8 --

str和unicode介绍

str和unicode都是basestring的子类 str其实是字节串 unicode才是真正的字符串
这里写图片描述

编码转换详解

可以将unicode理解为普通话, 其他编码理解为方言. 大家都理解听懂普通话,不一定听懂方言. 因此unicode必然成为中间编码. 即先将其他编码的字符串解码 (decode)成unicode,再从unicode编码(encode)成另一种编码
decode的作用是将其他编码的字符串转换成unicode编码,如 str1.decode(‘gb2312’),表示将gb2312编码的字符串转换成unicode编码
encode的作用是将unicode编码转换成其他编码的字符串,如 str2.encode(‘gb2312’),表示将unicode编码的字符串转换成gb2312编码。

博客来源: http://blog.csdn.net/juanjuel

0 0
原创粉丝点击