java中对Byte字符数组定长截取的方法
来源:互联网 发布:播放器源码 编辑:程序博客网 时间:2024/05/22 12:51
今天在在处理从网络上接收到的字符串,因为是从后台C语言过来的一组拼接的字符串,要定长截取,然而由于C语言是用Byte的方式计数,而java中是用Unicode编码的方式计数,一个中文汉字以Bytes的方式是两个字节,而用Unicode的方式是一个字,所以难以准确的截取出我想到的内容,经过半天的探索发现应该以如下的方式来解决。
先将字符串转换为Bytes【】数组,编码方式为“Unicode”,转出来的数组中的第一位和第二位是-2和-1,真正的内容从第三位开始,所有的字符都占用两个字节的空间,如果是英文和字母则第一个空间为0,如果是汉字就不是0,通过这样的方法就可以正确处理截取字符串的内容了!
public static String bSubstring(String s, int length) throws Exception { byte[] bytes = s.getBytes("Unicode"); int n = 0; // 表示当前的字节数 int i = 2; // 要截取的字节数,从第3个字节开始 for (; i < bytes.length && n < length; i++) { // 奇数位置,如3、5、7等,为UCS2编码中两个字节的第二个字节 if (i % 2 == 1) { n++; // 在UCS2第二个字节时n加1 } else { // 当UCS2编码的第一个字节不等于0时,该UCS2字符为汉字,一个汉字算两个字节 if (bytes[i] != 0) { n++; } } } // 如果i为奇数时,处理成偶数 if (i % 2 == 1) { // 该UCS2字符是汉字时,去掉这个截一半的汉字 if (bytes[i - 1] != 0) i = i - 1; // 该UCS2字符是字母或数字,则保留该字符 else i = i + 1; } return new String(bytes, 0, i, "Unicode"); }
- java中对Byte字符数组定长截取的方法
- Java中截取定长字符串的方法
- Java中字符和byte数组之间的相互转换
- Java中字符和byte数组之间的相互转换
- Java中字符和byte数组之间的相互转换
- java byte数组如何截取
- java中把对象转化为byte数组的方法
- python,C#,JAVA字符数组byte[]的MD5
- Java的byte数组
- [踏石留印之Android] byte[]数组的截取方法arraycopy与串口数据流处理
- java中对字符测试有用的方法
- java中不定长参数方法与定长参数方法的重载
- 如何把一个8位的时间类型字符串(“2017-08-04”)存进一个定长为3的byte数组中
- Java中byte转int的方法
- java中一些数据格式判断、转换的方法(手机号、邮箱格式,byte数组转String)
- Java 十六进制字符与byte数组转换
- 结构体与byte数组转换/结构体内定长数组
- java中常用的字符串截取方法
- create_singlethread_workqueue
- STM32驱动12bit AD TLC2543(I/O模拟方式)
- HDFS------hadoop fs -get命令的代码执行过程
- 循序渐进学习嵌入式Linux开发技术(转)
- Linux菜鸟入门级命令大全
- java中对Byte字符数组定长截取的方法
- jquery控制元素的显示和隐藏
- 操作符笔记
- java NIO Netty实现原理浅析(转)
- 算法 时间复杂度|空间复杂度
- 使IE6下PNG背景透明的七种方法任你选
- C++随机函数
- 最全的CSS浏览器兼容问题
- SurfaceView的基本使用