Java复习之常见的编码方式

来源:互联网 发布:java基础试题及答案 编辑:程序博客网 时间:2024/06/06 00:02

这篇博客主要是用来简单的总结一下Java中的编码方式

在程序中如果没有处理好字符的编码,就有可能出现乱码的问题。下面我们一起介绍在开发中常见的编码问题有哪些。

在计算机的世界里,任何文字都是以指定的编码方式存在的。

常见的编码有:ISO8859-1,GBK/GB2312,Unicode,UTF

ISO8859-1
属于单字节编码,最多只能表示0-255的字符范围,主要在英文上引用,表示汉字的时候则乱码,因为汉字占据两个字节

GBK/GB2312
中文的国际编码,专门用来表示汉字,是双字节编码

Unicode
java中就是使用此编码方式,也是最标准的一种编码,是使用16进制表示的编码。但是这个编码不兼容iso8859-1编码

UTF
由于Unicode不支持iso8859-1编码,而且容易占据更多的空间而且对于英文字母也需要使用两个字节编码,这样使用unicode不便于传输和存储,因此产生了utf编码,utf编码兼容了iso8859-1编码,也可以用来表示所有语言字符,不过utf是不定长的编码,每个字符的长度从1-6个字节不等,一般在中文的网页中使用此编码,因为这样可以节省空间。

造成乱码的根本原因:
1.程序使用的编码与本机的编码不统一
2.在网络中,客户端与服务端编码不统一

0 0