编码类型及python中实现转换
来源:互联网 发布:mac 连接文件服务器 编辑:程序博客网 时间:2024/05/14 17:41
常见编码类型
常见的编码类型为ASCII码,unicode,UTF-8,GB码等。
ASCII码
ASCII码为最早编入计算机的128个字母数字和符号,为单字节(8bit为1字节)。unicode
为了统一编码,解决各国编码语言不同的问题,unicode诞生。常为两字节。utf-8
unicode解决了编码不同的问题,但对于英文字母是只需要单字节存储的,如果使用unicode,有时会造成不必要的空间浪费。
UTF-8编码(可变长编码)把一个Unicode字符根据不同的数字大小编码成1-6个字节,常用的英文字母被编码成1个字节,汉字通常是3个字节,只有很生僻的字符才会被编码成4-6个字节。如果你要传输的文本包含大量英文字符,用UTF-8编码就能节省空间。GB码
GB就是“国标”的意思,即:中华人民共和国国家标准。GB码是面向汉字的编码,包括GB2312(GB2312-80),GBK,GB18030,表示范围从小到大递增,而且基本是向下兼容的。此外经常遇到一种叫做CP936的编码,实际上可以大概看做是GBK。
在计算机内存中,统一使用Unicode编码,当需要保存到硬盘或者需要传输的时候,就转换为UTF-8编码。
python中可通过如下方式查看编码类型
import chardet s = '一段测试的汉字呀' print chardet.detect(s)
编码转换
utf-8 —> GBK
#先转码成unicode再转为GBKs.decode('utf-8').encode('gbk')
GBK —> utf-8
#先转码成unicode再转为utf-8s.decode('gbk').encode('utf-8') #也可以直接指定的编码格式编码字符串s.encoding = 'utf-8'
阅读全文
0 0
- 编码类型及python中实现转换
- python编码类型转换及字符集探讨
- python编码类型转换及字符集探讨
- python的编码类型转换
- python的编码类型转换
- python中编码转换
- python中类型转换
- python中类型转换
- python中类型转换
- Python类型转换及帮助
- Python中bool类型转换
- Python3中内置类型bytes和str用法及byte和string之间各种编码转换
- python基本类型、操作及相互转换
- Python核心数据类型及类型显示转换
- 02Python数据类型及类型间转换
- python中http的一些编码转换
- 【python实现】ip转换为Long类型
- python实现批量转换文件编码(批转换编码示例)
- java基础
- Laravel Application Object
- Greendao操作数据库
- ubuntn常用备份方法
- 基于HTML5 Boilerplate创建自己的项目
- 编码类型及python中实现转换
- access中数据类型转换函数
- spaCy-入门01-windows 环境搭建
- 2017.08.16 利用python构建简易图片浏览器
- CodeForces
- 一只java小白的一些开发日记
- Spring源码解析-bean的加载
- 【jzoj5286】【NOIP2017提高A组模拟8.16】【花花的森林 】【时间倒流】
- 二叉树的操作:创建、遍历、求树的深度、叶子结点数