"Unicode"编码,java实现一个按字节截取字符串的子串的方法

来源:互联网 发布:万方数据库与中国知网 编辑:程序博客网 时间:2024/05/16 08:58
public static String bSubstring(String s, int length) throws UnsupportedEncodingException {
        
        byte[] b=s.getBytes("Unicode");
        //字节数组前两位是符号位,故i从2开始
        int i=2;
        int n=0;//记录当前截取字节数
        //根据截取长度n来判断i的值
        for (; i < b.length && n<length; i++) {
            //当i为奇数时
            if(i%2==1){
                n++;
            }else{
                //当b[i]不为0时,是汉字,汉字是两个字节,故n要加两次。而字母是算一个字节,故n只加一次
                if(b[i]!=0){
                    n++;
                }
            }
        }
        //如果i是奇数时,判断最后一位是否是汉字,如果是汉字则舍弃第b[i],如果是英文,则i++
        if(i%2==1){
            //如果i是奇数,并且后一位不是0,则是汉字位置
            if(b[i-1]!=0){
                i--;
            }else{
                i++;
            }
        }

        return new String(b,0,i,"Unicode");//返回按照索引生成字符串

}

0 0
原创粉丝点击