byte[] 转换成String,再getBytes()之后byte[]内容与原数组不同

来源:互联网 发布:青岛it 编辑:程序博客网 时间:2024/06/14 08:31

这里写图片描述

问题代码

 byte[] bytes = new byte[]{40, -37, -96, 46, -75, -10}; byte[] myBytes = new String(bytes).getBytes(); System.out.println(Arrays.toString(bytes)); System.out.println(Arrays.toString(myBytes));

输出结果

输出结果

问题原因

new String(byte[])和getBytes()默认使用的编码都是通过这条语句获取的编码

String csn = Charset.defaultCharset().name();

这里写图片描述

这里写图片描述

而我当前环境的编码为UTF-8
这里写图片描述

所以在我的环境下,下面两句代码实际上是等效的

byte[] bytes1 = new String(bytes).getBytes();byte[] bytes2 = new String(bytes, CharEncoding.UTF_8).getBytes(CharEncoding.UTF_8);

解决原理

由于UTF-8是多字节编码,需要用多个字节来表示一个字符的编码,所以也就出现了在转换之后byte[]数组长度、内容不一致的情况。

而ISO-8859-1编码是单字节编码,所以使用该编码就不会出现上面的问题

byte[] bytes3 = new String(bytes, CharEncoding.ISO_8859_1).getBytes(CharEncoding.ISO_8859_1);