[Java]_[初级]_[utf8编码的byte[]数组转换为String时要注意的问题]

来源：互联网发布：数据库审计系统报价编辑：程序博客网时间：2024/06/06 07:50

场景：

1. 通过socket给Java传递byte[]数组时，utf-8的字节数组在转换为String, Java并不会遇到0就停止结束，而是一直使用完byte[]的容量，

所以在转换为Java的String需要自己判断字节值是0的位置，再截取数组长度。

public  static int searchByte(byte[] data, byte value) {int size = data.length;for (int i = 0; i < size; ++i) {if (data[i] == value) {return i;}}return -1;}public static void main(String[] args) {byte[] info = new byte[10];info[0] = 0x31;info[1] = 0x31;info[2] = 0;info[3] = 0x1;info[4] = 0x32;info[5] = 0;try {String utf8 = new String(info, "UTF-8");// 1.这里时数组的大小,而不是2,String即使遇到0也会继续加载到String里.// 输出: 10System.out.println("" + utf8.length());// 1.输出很奇怪,不会输出不可见字符的占位符// 输出: 112System.out.println(utf8);if (utf8.equalsIgnoreCase("112")) {// 和112不等,这里不会输出.System.out.println("It is same with 112");}byte[] info1 = utf8.getBytes("UTF-8");// 1. 还原为byte[],发现数据并没有丢失.// 输出: 10:0:1:50System.out.println("info1: " + info1.length + ":" + info1[2] + ":"+ info1[3] + ":" + info1[4]);// 1. 所以如果需要到0结束的utf8字节数组,需要自己判断0并截取.int offset = -1;// binarySearch 必须要数组升序排序了才可以用,所以不能用.// offset = Arrays.binarySearch(info, (byte)0);offset = searchByte(info,(byte)0);String info2 = new String(info, 0, offset, "UTF-8");// 输出: 11System.out.println("info2: " + info2);// 输出: 2System.out.println("" + info2.length());} catch (UnsupportedEncodingException e) {// TODO Auto-generated catch blocke.printStackTrace();}}

1 3