关于ANSI编码

来源:互联网 发布:心理沙盘 知乎 编辑:程序博客网 时间:2024/06/10 10:21
关于ANSI编码
  unicode和ansi都是字符代码的一种表示形式。
  为使计算机支持更多语言,通常使用 0x80~0xFF 范围的 2 个字节来表示 1 个字符。比如:汉字 '中' 在中文操作系统中,使用 [0xD6,0xD0] 这两个字节存储。
  不同的国家和地区制定了不同的标准,由此产生了 GB2312, BIG5, JIS 等各自的编码标准。这些使用 2 个字节来代表一个字符的各种汉字延伸编码方式,称为 ANSI 编码。在简体中文系统下,ANSI 编码代表 GB2312 编码,在日文操作系统下,ANSI 编码代表 JIS 编码。
  不同 ANSI 编码之间互不兼容,当信息在国际间交流时,无法将属于两种语言的文字,存储在同一段 ANSI 编码的文本中。
(以上摘录自百度百科中ANSI的解释)

GB编码可称作中国的国标码,先后有GB2312,GBK,GB18030,三种编码向前兼容,现在windows使用的是GB18030。GB2312只收录了6763个汉字,有些生僻字不包含在内,比如朱镕基的“镕”,在编程时最好选用GBK或GB18030。

制作网页时更好的选择是utf-8,他是世界语unicode编码的转化形式(8-bit Unicode Transformation Format),服务器选用Linux时特别推荐,因为Linux默认字符集也是utf-8.
原创粉丝点击