Java字符串所占字节数的小总结
来源:互联网 发布:头皮痒 知乎 编辑:程序博客网 时间:2024/05/16 14:33
首先,char为Java的基本类型,基本类型所占的字节数是固定的,如int占4字节,double占8字节,这可以使得Java在不同的平台上所占类型固定,很好地保证了Java的可移植性。因此,Java中char类型固定占2个字节。(注:char类型也可以存储一个汉字)。
其次,String采用一种更灵活的方式进行存储。在String中,一个英文字符占1个字节,而中文字符根据编码的不同所占字节数也不同。在UTF-8编码下,一个中文字符占3个字节;而使用GBK编码时一个中文字符占2个字节。测试代码如下:
import java.io.UnsupportedEncodingException;public class StrTest { public static void main(String[] args) throws UnsupportedEncodingException { String str1 = "hello"; String str2 = "你好abc"; System.out.println("utf-8编码下'hello'所占的字节数:" + str1.getBytes("utf-8").length); System.out.println("gbk编码下'hello'所占的字节数:" + str1.getBytes("gbk").length); System.out.println("utf-8编码下'你好abc'所占的字节数:" + str2.getBytes("utf-8").length); System.out.println("gbk编码下你好'你好abc'所占的字节数:" + str2.getBytes("gbk").length); }}
输出结果:
utf-8编码下’hello’所占的字节数: 5
gbk编码下’hello’所占的字节数: 5
utf-8编码下’你好abc’所占的字节数: 9
gbk编码下你好’你好abc’所占的字节数: 7
由此可见,对也String来说,一个英文字符固定占1个字节,而中文字符占2个(GBK编码)或3个(UTF-8编码)字节。也可使用此方法查看其它编码的情况,此处不再一一赘述。
最后,基于String的这种特性,可以判断一个字符串中是否包含中文,举例如下:
public class StrTest { public static void main(String[] args) throws UnsupportedEncodingException { searchChineseCharacter("Good morning"); searchChineseCharacter("hello 早上好"); } //找出一个字符串中的汉字 public static void searchChineseCharacter(String str){ //正则表达式,用于匹配中文字符 String regex = "[\u4e00-\u9fa5]"; //如果str的长度和其所占字节数不等,说明包含中文 if (str.length() != str.getBytes().length){ Pattern pattern = Pattern.compile(regex); Matcher matcher = pattern.matcher(str); System.out.print("'" + str + "' 中的汉字为:"); while (matcher.find()){ System.out.print(matcher.group()); } } else { System.out.println("'" + str + "' 中无汉字"); } }}
输出结果:
‘Good morning’ 中无汉字
‘hello 早上好’ 中的汉字为:早上好
1 0
- Java字符串所占字节数的小总结
- 判断字符串所占的字节数
- Java中字符编码和字符串所占字节数
- Java中字符编码和字符串所占字节数 .
- Java中字符编码和字符串所占字节数
- JS计算字符串所占字节数
- JS计算字符串所占字节数
- JS计算字符串所占字节数
- Java中文字符所占的字节数
- JAVA与android 基本数据类型所占的字节数
- Java中文字符所占的字节数
- Java中文字符所占的字节数
- Java 各基本数据类型和所占的字节数
- java中文所占字节数
- java数据类型所占字节数
- 计算机类所占的字节数
- 判断一个含汉字的字符串的所占的字节数(汉字占两个字节)
- Java中字符串在不同字符编码中所占字节数
- Caused by: android.content.res.Resources$NotFoundExceptiton
- 洛谷 P1026 统计单词个数
- jsdom
- 智能小车-----寻迹的代码
- java8 新特性入门 stream/lambda
- Java字符串所占字节数的小总结
- C语言(19)-----二维数组
- unity学习笔记4
- 让你的代码量减少3倍!使用kotlin开发Android(二) --秘笈!扩展函数
- 48. 减少 DNS 查找(9)
- 文章标题
- 分页技术
- 操作系统
- Leetcode(62)Unique Paths