编码格式
来源:互联网 发布:俄罗斯手机聊天软件 编辑:程序博客网 时间:2024/05/20 07:54
首先,Java中的一个char是2个字节。java采用unicode,2个字节来表示一个字符,这点与C语言中不同,c语言中采用ASCII,在大多数系统中,一个char通常占1个字节,但是在0~127整数之间的字符映射,unicode向下兼容ASCII。而Java采用unicode来表示字符,一个中文或英文字符的unicode编码都占2个字节,但如果采用其他编码方式,一个字符占用的字节数则各不相同。在 GB 2312 编码或 GBK 编码中,一个英文字母字符存储需要1个字节,一个汉字字符存储需要2个字节。 在UTF-8编码中,一个英文字母字符存储需要1个字节,一个汉字字符储存需要3到4个字节。在UTF-16编码中,一个英文字母字符存储需要2个字节,一个汉字字符储存需要3到4个字节(Unicode扩展区的一些汉字存储需要4个字节)。在UTF-32编码中,世界上任何字符的存储都需要4个字节。
1、我的系统的默认编码方式为GBK,因此对于字符串 “你好hello”,
如果调用length()方法返回其长度,得到的结果将为:7。该方法返回的是字符串的字符数,无论是中文字符还是英文字符,都被看做是一个字符。
如果将其转换为byte数组,而后返回byte数组的长度,得到的结果将为:9。因为在GBK编码中,中文占2个字节,而英文字符占1个字节。
执行如下代码,将得到如下图所示的输出:
输出结果如下图:
2、将编码方式为改为utf-8,即执行如下代码:
对于字符串 “你好hello”,得到的输出结果如下:
此时得到的的byte数组的长度为:11。因为在utf-8编码中,该中文字符占了3个字节,英文字符占1个字节。
3、如果将编码方式改为:utf-16,输出结果如下:
此时得到的的byte数组的长度为:16。因为在utf-16编码中,该中文字符占了3个字节,英文字符占2个字节。
3、如果将编码方式改为:utf-32,输出结果如下:
此时得到的的byte数组的长度为:28。因为在utf-32编码中,所有的字符均占4个字节。
阅读全文
0 0
- 编码格式
- 编码格式
- 编码格式
- 编码格式
- 编码格式
- 编码格式
- 编码格式
- 编码格式
- 编码格式
- 编码格式
- 编码格式
- 编码格式
- 编码格式
- 编码格式
- 编码格式
- 编码与编码格式?
- 容器格式和编码格式
- VBScript编码规范格式
- STM32时钟
- 第一份工作总结
- RabbitMq、ActiveMq、ZeroMq、kafka之间的比较,资料汇总
- 软件测试工具
- 贪心之区间覆盖问题(区间选点)
- 编码格式
- 3344-->数据结构实验之二叉树五:层序遍历
- JVM、Java编译器和Java解释器
- Ubuntu16.04安装32位支持库
- ffmpeg编解码之图片转视频
- Java 生成二维码
- jquery的ajax用serialize传值,后台接受,中文乱码解决方法
- 简述Tomcat的日志系统
- oracle创建用户并给用户授权查询指定表或视图的权限