在Java中按字节获得字符串长度的两种方法
来源:互联网 发布:沧海一声笑歌词知乎 编辑:程序博客网 时间:2024/05/16 06:28
由于Java是基于Unicode编码的,因此,一个汉字的长度为1,而不是2。但有时需要以字节单位获得字符串的长度。例如,“123abc长城”按字节长度计算是10,而按Unicode计算长度是8。为了获得10,需要从头扫描根据字符的Ascii来获得具体的长度。如果是标准的字符,Ascii的范围是0至255,如果是汉字或其他全角字符,Ascii会大于255。因此,可以编写如下的方法来获得以字节为单位的字符串长度。
Code highlighting produced by Actipro CodeHighlighter (freeware)
http://www.CodeHighlighter.com/
--> public int getWordCount(String s)
{
int length = 0;
for(int i = 0; i < s.length(); i++)
{
int ascii = Character.codePointAt(s, i);
if(ascii >= 0 && ascii <=255)
length++;
else
length += 2;
}
return length;
}
当然,也可以采用正则表达式来简化上面的方法,代码如下:
Code highlighting produced by Actipro CodeHighlighter (freeware)
http://www.CodeHighlighter.com/
--> public int getWordCount(String s)
{
s = s.replaceAll("[^\\x00-\\xff]", "**");
int length = s.length();
return length;
} 上面代码的基本原理是将字符串中所有的非标准字符(双字节字符)替换成两个标准字符(**,或其他的也可以)。这样就可以直接例用length方法获得字符串的字节长度了。
Code highlighting produced by Actipro CodeHighlighter (freeware)
http://www.CodeHighlighter.com/
--> public int getWordCount(String s)
{
int length = 0;
for(int i = 0; i < s.length(); i++)
{
int ascii = Character.codePointAt(s, i);
if(ascii >= 0 && ascii <=255)
length++;
else
length += 2;
}
return length;
}
当然,也可以采用正则表达式来简化上面的方法,代码如下:
Code highlighting produced by Actipro CodeHighlighter (freeware)
http://www.CodeHighlighter.com/
--> public int getWordCount(String s)
{
s = s.replaceAll("[^\\x00-\\xff]", "**");
int length = s.length();
return length;
}
- 在 Java中按字节获得字符串长度的两种方法
- 在Java中按字节获得字符串长度的两种方法
- 在Java中按字节获得字符串长度的两种方法
- 在 Java中按字节获得字符串长度的两种方法
- 在Java中按字节获得字符串长度的两种方法
- 在Java中按字节获得字符串长度的两种方法
- 在Java中按字节获得字符串长度的两种方法
- 在Java中按字节获得字符串长度的两种方法
- 在Java中按字节获得字符串长度的两种方法
- Java 按字节获得字符串(中文)长度
- JAVA中获得一个有中文的字符串的字节长度
- 用Java实现按字节长度截取字符串的方法
- 用Java实现按字节长度截取字符串的方法
- 用Java实现按字节长度截取字符串的方法
- Java实现按字节长度截取字符串的方法
- Java实现按字节长度截取字符串的方法
- 获得字符串对应的字节长度
- 获得一串字符串数据长度的高位字节和 低位字节的方法
- MFC 静态文本框修改内容
- 我所知道的ACPI(3) -- ASL 入门简介
- 青蛙又回到了井里
- Openfiler iscsiadm: No portals found 解决方法
- 程序员之路——一个老程序员对刚上大学的学弟学妹的忠告
- 在Java中按字节获得字符串长度的两种方法
- 互斥对象可以在进程间使用,而临界区对象只能在同一进程的各线程间使用
- 创建图结构
- VC中多线程使用比较广泛而且实用,在网上看到的教程.感觉写的挺好.
- 定义一个CMS的前景如何?
- C++上机报告 利用公式计算π=4(1-1/3+1/5-1/7+1/9-...)的近似值,直到括号中最后一项的绝对值小于0.000001为止。
- make 变量 赋值 区别
- 七夕情书之恋恋红尘
- WORD上次启动时失败,以安全模式启动WORD将帮助您纠正或发现启动中的问题