各种编码简单区别

来源:互联网 发布:淘宝造物节h5链接 编辑:程序博客网 时间:2024/05/06 09:51

ANSI
ANSI码 对于windows系统来说的话就是指当前的系统编码。如果是英文系统,那么ANSI码就是指ascii码,如果是中文系统的windows,比如xp,那么ANSI码就是指GBK。

ASCII
定长,7位,一个字节
范围为0到127,128-255的ASCII码则没有定义,英语国家用

ISO8859-1
定长,8位,一个字节
范围0-255,扩展ASCII码,欧洲国家用

GBK GB2312
双字节  非定长
其中gbk编码能够用来同时表示繁体字和简体字,而gb2312只能表示简体字,gbk是兼容gb2312编码的。

BIG5
双字节  繁体字香港台湾使用

UNICODE
定长   双字节
它是不兼容iso8859-1编码的,也不兼容任何编码。不过,相对于iso8859-1编码来说,uniocode编码只是在前面增加了一个0字节,比如字母a为"00 61"。

UTF-8
不定长 1到6个字节
utf编码 是不定长编码,每一个字符的长度从1-6个字节不等。另外,utf编码自带简单的校验功能。一般来讲,英文字母都是用一个字节表示,而汉字使用三个字节。
0 0