常见编码占用字节数
来源:互联网 发布:windows 查看内存占用 编辑:程序博客网 时间:2024/04/29 06:58
常见编码对中英文字符的支持及占用字节数
使用 Java 验证
import java.io.UnsupportedEncodingException;import org.junit.Test;public class EncodeTest { @Test public void test() throws UnsupportedEncodingException { String characterEn = "A"; String characterZhSimple = "简"; String characterZhComplex = "簡"; System.out.println("ASCII编码字节数:"); System.out.println("英文字符:" + characterEn.getBytes("ASCII").length); System.out.println(); System.out.println("Unicode编码字节数:"); System.out.println("英文字符:" + characterEn.getBytes("Unicode").length); System.out.println("中文简体:" + characterZhSimple.getBytes("Unicode").length); System.out.println("中文繁体:" + characterZhComplex.getBytes("Unicode").length); System.out.println(); System.out.println("UTF-8编码字节数:"); System.out.println("英文字符:" + characterEn.getBytes("UTF-8").length); System.out.println("中文简体:" + characterZhSimple.getBytes("UTF-8").length); System.out.println("中文繁体:" + characterZhComplex.getBytes("UTF-8").length); System.out.println(); System.out.println("UTF-16编码字节数:"); System.out.println("英文字符:" + characterEn.getBytes("UTF-16").length); System.out.println("中文简体:" + characterZhSimple.getBytes("UTF-16").length); System.out.println("中文繁体:" + characterZhComplex.getBytes("UTF-16").length); System.out.println(); System.out.println("GB2312编码字节数:"); System.out.println("英文字符:" + characterEn.getBytes("GB2312").length); System.out.println("中文简体:" + characterZhSimple.getBytes("GB2312").length); System.out.println(); System.out.println("BIG5编码字节数:"); System.out.println("英文字符:" + characterEn.getBytes("BIG5").length); System.out.println("中文繁体:" + characterZhComplex.getBytes("BIG5").length); System.out.println(); System.out.println("GBK编码字节数:"); System.out.println("英文字符:" + characterEn.getBytes("GBK").length); System.out.println("中文简体:" + characterZhSimple.getBytes("GBK").length); System.out.println("中文繁体:" + characterZhComplex.getBytes("GBK").length); System.out.println(); System.out.println("GB18030编码字节数:"); System.out.println("英文字符:" + characterEn.getBytes("GB18030").length); System.out.println("中文简体:" + characterZhSimple.getBytes("GB18030").length); System.out.println("中文繁体:" + characterZhComplex.getBytes("GB18030").length); System.out.println(); System.out.println("ISO-8859-1编码字节数:"); System.out.println("英文字符:" + characterEn.getBytes("ISO-8859-1").length); System.out.println(); }}
验证结果:
ASCII编码字节数:英文字符:1Unicode编码字节数:英文字符:4中文简体:4中文繁体:4UTF-8编码字节数:英文字符:1中文简体:3中文繁体:3UTF-16编码字节数:英文字符:4中文简体:4中文繁体:4GB2312编码字节数:英文字符:1中文简体:2BIG5编码字节数:英文字符:1中文繁体:2GBK编码字节数:英文字符:1中文简体:2中文繁体:2GB18030编码字节数:英文字符:1中文简体:2中文繁体:2ISO-8859-1编码字节数:英文字符:1
阅读全文
0 0
- 常见编码占用字节数
- C++复习笔记 常见数据类型占用的字节数
- Ansi与Unicode编码的转换及占用字节数
- JAVA各种编码所占用的字节数
- 关于一些编码格式占用的字节数
- '\0' 占用字节数
- Java 占用字节数
- C# 变量占用字节数
- c# 数据类型占用字节数
- 计算字符串占用字节数
- 指针类型占用字节数
- struct、class占用字节数
- C#数据类型占用字节数
- 常见数据类型字节数
- java不同的编码格式下字符串所占用的字节数
- 中文字符占用字节数在不同编码方式下的区别
- 汉字UTF8编码占用几个字节
- 三种常见的编码:ASCII码、UTF-8编码、Unicode编码等字符占据的字节数
- Java maven 打包配置分离
- rabbitMQ-python
- 第十周项目1-验证算法(2)
- 最小生成树例题及其总结
- 作业
- 常见编码占用字节数
- 第十周项目1(4)---哈夫曼编码的算法验证
- 火狐放不了html5 video MP4格式
- jQuery遍历-后代
- vscode: Visual Studio Code 常用快捷键(二)
- Linux学习(二十七):TCP/IP网络编程之本地通信
- HSV颜色模型及颜色分量范围
- 第九周项目1-二叉树算法库
- storm-sparkstreaming-对比