ASCII,Unicode,UTF-8

来源:互联网 发布:hp m1136驱动下载 mac 编辑:程序博客网 时间:2024/06/05 22:51

ASCII码

全称:American Standard Code for Information Interchange 美国信息交换标准代码,主要用于显示26个英文字母、阿拉伯数字以及一些英文符号。
在计算机中,所有的数据在存储和运算时都要使用二进制数表示,如果每个人都有一套编码的标准就会让通讯困难,所以美国有关的标准化组织就出台了ASCII编码,统一规定了上述常用符号用哪些二进制数来表示。
来自百度
由于是美国的标准,不能很好满足其他国家需求,所以国际标准化组织推荐了一个ASCII的变种,代码“0x40、0x5B、0x5C、0x5D、0x7B、0x7C和0x7D“为国家使用保留。

Unicode

随着计算机普及,仅仅是ASCII码已经不足以满足需求,为了解决传统的字符编码方案的局限,Unicode产生了,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。
目前的Unicode字符分为17组编排,0x0000 至 0xFFFF,每组称为平面(Plane),而每平面拥有65536个码位,共1114112个。这么多的组合,为各种文字符号提供了位置,让不同国家的人也能用一套编码。

UTF-8

Unicode不是支持所有文字,而且用来表示一些比较简单的符号是也过于繁琐,UTF-8以字节为单位对Unicode进行编码,是一种可变长度字符编码,更加灵活高效。
Unicode转换为UTF-8时,可以将Unicode二进制从低位往高位取出二进制数字,每次取6位,前面按格式填补,不足8位用0填补。
UTF-8编码可以通过屏蔽位和移位操作快速读写,这是它的优点之一。

原创粉丝点击