Unicode编码区分

来源:互联网 发布:淘宝客 php 编辑:程序博客网 时间:2024/06/05 11:12

Unicode:Unicode(统一码、万国码、单一码) 计算机科学领域里的一项业界标准,是计算机科学领域里的一项业界标准,包括字符集、编码方案等。Unicode 是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。


作用
能够使计算机实现跨语言、跨平台的文本转换及处理。

层次
Unicode 编码系统,可分为编码方式和实现方式两个层次。

方式
Unicode是国际组织制定的可以容纳世界上所有文字和符号的字符编码方案。

UTF-8
UTF-8以字节为单位对Unicode进行编码。

UTF-8(8-bit Unicode Transformation Format)是一种针对Unicode的可变长度字符编码,又称万国码。

UTF-16
UTF-16编码以16位无符号整数为单位。

UTF-32
UTF-32编码以32位无符号整数为单位。

字节序
字节序有两种,分别是“大端”(Big Endian, BE)和“小端”(Little Endian, LE)。