Python3 字符编码

来源:互联网 发布:网络道德规范的主体是 编辑:程序博客网 时间:2024/06/02 06:43

初入Python3就写一个串口的小程序,就被一堆错误弄得焦头烂额,折腾了半天全是编码的问题。

1、代码开头一定要加上

#-*- coding: UTF-8 -*-

因为Python文件当中是不支持中文的,即使是注释中有中文也不行,为了解决这个问题,就需要把文件编码类型改为utf-8类型。

最初就是程序自动加上了一段注释,里面有“2014年11月XX日”,就出现了问题,一直报存在:

SyntaxError: Non-ASCII character xxxx in file  on line x, but no encoding declared;

实际上Python只检查#、coding和编码字符串,其他的字符都是为了美观加上的。


2、str 与bytes类型

       Python 3最重要的新特性大概要算是对文本和二进制数据作了更为清晰的区分。文本总是Unicode,由str类型表示,二进制数据则由bytes类型表示。Python 3不会以任意隐式的方式混用str和bytes,正是这使得两者的区分特别清晰。你不能拼接字符串和字节包,也无法在字节包里搜索字符串(反之亦然),也不能将字符串传入参数为字节包的函数(反之亦然)。

      在Python3中,字符串默认为unicode格式,这样在写串口时,就必须将字符串编码为字节包 ,否则一直会报:

      TypeError: an integer is required

import serialt=serial.Serial('com4',9600)n=t.write('hello world'.encode('utf-8'))print (t.portstr)print (n)str1=t.read(n)print (str1)t.close()



0 0