常见字符编码

来源：互联网发布：紫格尼克效应知乎编辑：程序博客网时间：2024/06/08 03:32

在程序中如果没有处理好字符的编码，就有可能出现乱码问题。下面我为大家介绍开发中常见的字符编码。

在计算机世界里，任何的指定文字都是以指定的编码方式存在的，特别是中文字符。常见的编码方式有：

ISO8859-1（单字节编码，表示英文）、GBK/GB2312（双字节编码，常用语表示中文）、unicode、UTF（全世界统一编码方式，可以用于任何编码）。

ISO8859-1：

编码属于单字节编码，最多只能表示0-255的字符范围，主要在英文上应用。

GBK/GB2312：

中文的国际编码，专门用来表示汉字，属于双字节编码。

unicode：

Java中就是使用此编码方式，也是最标准的一种编码方式，是使用16进制表示的编码。但此编码不兼容ISO8859-1编码。

UTF：

由于unicode不支持ISO8859-1编码，而且容易占用更多的空间，对于英文字母也要使用两个字节编码，这样使得unicode不便于传输和储存，因此产生了UTF编码。UTF编码兼容了ISO8859-1编码，也可以用来表示所有语言字符，不过UTF是不定长编码，每个字符的长度有1-6个字节不等，一般在中文网页中使用此编码，因为这样可以节省空间。

造成乱码的根本原因：

1.程序使用的编码与本机的编码不统一；

2.在网络中客户端和服务端编码不统一。

0 0