python第三方库系列之十五--编码库
来源:互联网 发布:js计算时间差 编辑:程序博客网 时间:2024/05/21 09:35
首先上一张图:
我们知道:1字节=8位
因为Python的诞生比Unicode标准发布的时间还要早,所以最早的Python只支持ASCII编码,普通的字符串'ABC'
在Python内部都是ASCII编码的。Python提供了ord()和chr()函数,可以把字母和对应的数字相互转换:
>>> ord('A')65>>> chr(65)'A'
Python在后来添加了对Unicode的支持,以Unicode表示的字符串用u'...'
表示,比如:
>>> print u'中文'中文>>> u'中'u'\u4e2d'
写u'中'
和u'\u4e2d'
是一样的,\u
后面是十六进制的Unicode码。因此,u'A'
和u'\u0041'
也是一样的。
两种字符串如何相互转换?字符串'xxx'
虽然是ASCII编码,但也可以看成是UTF-8编码,而u'xxx'
则只能是Unicode编码。
把u'xxx'
转换为UTF-8编码的'xxx'
用encode('utf-8')
方法:
>>> u'ABC'.encode('utf-8')'ABC'>>> u'中文'.encode('utf-8')'\xe4\xb8\xad\xe6\x96\x87'
英文字符转换后表示的UTF-8的值和Unicode值相等(但占用的存储空间不同),而中文字符转换后1个Unicode字符将变为3个UTF-8字符,你看到的\xe4
就是其中一个字节,因为它的值是228
,没有对应的字母可以显示,所以以十六进制显示字节的数值。len()
函数可以返回字符串的长度:
>>> len(u'ABC')3>>> len('ABC')3>>> len(u'中文')2>>> len('\xe4\xb8\xad\xe6\x96\x87')6
反过来,把UTF-8编码表示的字符串'xxx'
转换为Unicode字符串u'xxx'
用decode('utf-8')
方法:
>>> 'abc'.decode('utf-8')u'abc'>>> '\xe4\xb8\xad\xe6\x96\x87'.decode('utf-8')u'\u4e2d\u6587'>>> print '\xe4\xb8\xad\xe6\x96\x87'.decode('utf-8')中文
由于Python源代码也是一个文本文件,所以,当你的源代码中包含中文的时候,在保存源代码时,就需要务必指定保存为UTF-8编码。当Python解释器读取源代码时,为了让它按UTF-8编码读取,我们通常在文件开头写上这两行:
#!/usr/bin/env python# -*- coding: utf-8 -*-
第一行注释是为了告诉Linux/OS X系统,这是一个Python可执行程序,Windows系统会忽略这个注释;
第二行注释是为了告诉Python解释器,按照UTF-8编码读取源代码,否则,你在源代码中写的中文输出可能会有乱码。
- python第三方库系列之十五--编码库
- python第三方库系列之二十五--pip库
- python第三方库系列之二十六--virtualenv库
- python第三方库系列之二十三--路径库
- python第三方库系列之二--time库
- python第三方库系列之六--traceback库
- python第三方库系列之七--logging库
- python第三方库系列之八--uuid库
- python第三方库系列之九--os库
- python第三方库系列之十--commands库
- python第三方库系列之十二--多线程threading库
- python第三方库系列之十七--multiprocessing库
- python第三方库系列之二十一--python django的权限管理库
- python第三方库系列之十八--python/django test库
- python第三方库系列之十九--python测试使用的mock库
- python第三方库之numpy
- PyThon第三方库
- 第三方python库
- 华为认证网络工程师H3CNE培训教程集
- java多态讲解
- MalformedJsonException
- 群发时随机出现のcrash
- 3D塔防游戏实现 4.1 怪物3D空间自动移动(Feekood语言)
- python第三方库系列之十五--编码库
- 《Python核心编程》笔记 Python对象
- matlab把数据从胞元类型(cell)转换为矩阵类型(matrix)
- 生成条形码
- 调用火狐浏览器模拟天猫搜索并遍历一百页商品(速度较慢,但不会遇到反爬机制和验证码)
- Mysql联合查询UNION和UNION ALL的使用介绍
- VirtualBox错误 Unable to load R3 module 解决方案
- 由两种简单的遍历指定目录下文件的方法来看os模块中的一些方法
- 寒假14项目3——应用枚举