常见字符编码

来源:互联网 发布:紫格尼克效应 知乎 编辑:程序博客网 时间:2024/06/08 03:32

       在程序中如果没有处理好字符的编码,就有可能出现乱码问题。下面我为大家介绍开发中常见的字符编码。

在计算机世界里,任何的指定文字都是以指定的编码方式存在的,特别是中文字符。常见的编码方式有:

       ISO8859-1(单字节编码,表示英文)、GBK/GB2312(双字节编码,常用语表示中文)、unicode、UTF(全世界统一编码方式,可以用于任何编码)。

       ISO8859-1:

       编码属于单字节编码,最多只能表示0-255的字符范围,主要在英文上应用。

       GBK/GB2312:

       中文的国际编码,专门用来表示汉字,属于双字节编码。

       unicode:

       Java中就是使用此编码方式,也是最标准的一种编码方式,是使用16进制表示的编码。但此编码不兼容ISO8859-1编码。

       UTF:

       由于unicode不支持ISO8859-1编码,而且容易占用更多的空间,对于英文字母也要使用两个字节编码,这样使得unicode不便于传输和储存,因此产生了UTF编码。UTF编码兼容了ISO8859-1编码,也可以用来表示所有语言字符,不过UTF是不定长编码,每个字符的长度有1-6个字节不等,一般在中文网页中使用此编码,因为这样可以节省空间。

       造成乱码的根本原因:

       1.程序使用的编码与本机的编码不统一;

       2.在网络中客户端和服务端编码不统一。

0 0