字符编码——简短的描述和比较

来源:互联网 发布:贵州11选5遗漏数据查询 编辑:程序博客网 时间:2024/05/01 16:15


 字节支持补充ASCII1128字符,包括32个控制符号最高位为0扩展ASCII1256字符一些欧洲国家加入自己语言中的符号,但是各自不同GB23121 27445字符,6763个汉字和 682 个其它符号兼容ASCIIGBK1 221886字符,21003 个汉字兼容GB2312,微软制定,不是国家标准GB180301 2 4汉字27484个,少数民族、繁体、日韩完全兼容GB2312,基本兼容GBKANSI  ASCII+GB2312(简体中文版)/Big5(繁体中文版)UCS-22 Unicode实现方式之一UTF-81-4 Unicode实现方式之一,兼容ASCII

Unicode本身只是符号集合,规定了符号的二进制代码,但没有规定编码方式。当其作为编码方式时指UCS-2。UTF-8是互联网上使用最多的Unicode实现方式,另外还有UTF-16、UTF-32等等。UTF-16基本用2字节存储。UTF-32又称UCS-4,固定4字节。


参考:

http://www.ruanyifeng.com/blog/2007/10/ascii_unicode_and_utf-8.html

http://www.cnblogs.com/skynet/archive/2011/05/03/2035105.html

http://www.crifan.com/files/doc/docbook/char_encoding/release/html/char_encoding.html

http://www.laruence.com/2009/08/22/1059.html

0 0
原创粉丝点击