在Java中按字节获得字符串长度的两种方法
来源:互联网 发布:js怎样在数组中删除一 编辑:程序博客网 时间:2024/06/05 02:36
由于Java是基于Unicode编码的,因此,一个汉字的长度为1,而不是2。但有时需要以字节单位获得字符串的长度。例如,“123abc长城”按字节长度计算是10,而按Unicode计算长度是8。为了获得10,需要从头扫描根据字符的Ascii来获得具体的长度。如果是标准的字符,Ascii的范围是0至255,如果是汉字或其他全角字符,Ascii会大于255。因此,可以编写如下的方法来获得以字节为单位的字符串长度。
当然,也可以采用正则表达式来简化上面的方法,代码如下:
public int getWordCount(String s)
{
int length = 0;
for(int i = 0; i < s.length(); i++)
{
int ascii = Character.codePointAt(s, i);
if(ascii >= 0 && ascii <=255)
length++;
else
length += 2;
}
return length;
}
{
int length = 0;
for(int i = 0; i < s.length(); i++)
{
int ascii = Character.codePointAt(s, i);
if(ascii >= 0 && ascii <=255)
length++;
else
length += 2;
}
return length;
}
当然,也可以采用正则表达式来简化上面的方法,代码如下:
public int getWordCount(String s)
{
s = s.replaceAll("[^\\x00-\\xff]", "**");
int length = s.length();
return length;
}
{
s = s.replaceAll("[^\\x00-\\xff]", "**");
int length = s.length();
return length;
}
上面代码的基本原理是将字符串中所有的非标准字符(双字节字符)替换成两个标准字符(**,或其他的也可以)。这样就可以直接例用length方法获得字符串的字节长度了。
备注:String.getByte().length() ;//我用的utf-8获取的汉字长度为3,这种方式不适合我的需求。
出处:http://www.blogjava.net/nokiaguy/archive/2010/04/11/317982.html
0 0
- 在 Java中按字节获得字符串长度的两种方法
- 在Java中按字节获得字符串长度的两种方法
- 在Java中按字节获得字符串长度的两种方法
- 在 Java中按字节获得字符串长度的两种方法
- 在Java中按字节获得字符串长度的两种方法
- 在Java中按字节获得字符串长度的两种方法
- 在Java中按字节获得字符串长度的两种方法
- 在Java中按字节获得字符串长度的两种方法
- 在Java中按字节获得字符串长度的两种方法
- Java 按字节获得字符串(中文)长度
- JAVA中获得一个有中文的字符串的字节长度
- 用Java实现按字节长度截取字符串的方法
- 用Java实现按字节长度截取字符串的方法
- 用Java实现按字节长度截取字符串的方法
- Java实现按字节长度截取字符串的方法
- Java实现按字节长度截取字符串的方法
- 获得字符串对应的字节长度
- 获得一串字符串数据长度的高位字节和 低位字节的方法
- 使用WebView加载网页
- 黑马程序员--Java基础--异常及其简单处理
- 项目第二天
- JDBC 笔记1 利用Statement对数据库进行增删改查
- sicily 9094 Cows in a Row
- 在Java中按字节获得字符串长度的两种方法
- 内核中通过/proc/kallsyms获得符号的地址--全局变量snd_write_bypass
- 二维数组
- Android点滴(一)
- 基于矩阵实现的最短路径算法
- Android中图片的二次采样示例
- 结构体
- linux命令后台运行
- uboot.lds分析