Unicode 基础

来源:互联网 发布:最新的网络流行词 编辑:程序博客网 时间:2024/06/05 19:19

1、Unicode目的是对世界上的每一个字符分配一个唯一的编码,可以理解为是唯一的ID;

2、编码方式(摘自维基百科)

目前实际应用的统一码版本对应于UCS-2,使用16的编码空间。也就是每个字符占用2个字节。这样理论上一共最多可以表示216(即65536)个字符。基本满足各种语言的使用。实际上目前版本的统一码并未完全使用这16位编码,而是保留了大量空间以作为特殊使用或将来扩展。

基本多文种平面的字符的编码为U+hhhh,其中每个h代表一个十六进制数字,与UCS-2编码完全相同。例如“U+0041”代表字符“A”。

说明:unicode分了17个平面,每个平面包含65536个字符;为什么要分平面?不知道啊

3、实现方式(摘自维基百科)

Unicode的实现方式不同于编码方式。一个字符的Unicode编码是确定的。但是在实际传输过程中,由于不同系统平台的设计不一定一致,以及出于节省空间的目的,对Unicode编码的实现方式有所不同。Unicode的实现方式称为Unicode转换格式(Unicode Transformation Format,简称为UTF)。通常我们说的UTF-8、UTF-16和UTF-32都属于Unicode的实现方式。

原创粉丝点击