文本编码

来源:互联网 发布:优衣库官方网络旗舰店 编辑:程序博客网 时间:2024/05/17 23:42

  gbk编码中文占用2个字节,英文占用1个字节

  utf-8编码中文占用3个字节,英文占用1个字节

  Java是双字节编码,utf-16be编码,中文占用2个字节,英文占用2个字节

  当你的字节序列是某种编码时,这时想把字节序列变成字符串,也需要用这种编码方法,否则会出现乱码。

String str1 = new String(bytes);//用项目默认编码System.out.println(str1);//会出现乱码String str2 = new String(bytes4,"utf-16be");System.out.println(str2);

  文本文件就是字节序列,可以是任意编码的字节序列。如果我们在中文机器上直接创建文本文件,那么该文本文件只认识ansi编码。联通、联这是一种巧合,他们正好符合了utf-8编码的规则.