黑马程序员-字符编码

来源:互联网 发布:windows to go下载 编辑:程序博客网 时间:2024/05/22 04:39
黑马程序员-字符编码 - bb380667063 - Sun的博客
中文的编码数字都为负数。
 
GBK:2字节代表一个文字。
UTF-8:3字节代表一个文字。
编码:字符串变为字节数组。
解码:字节数子变为字符串。
String-byte[ ]  str.getBytes(charsetName)
byte[ ]-String  new String(byte[ ],charsetName)
byte[ ] b="abc".getBytes("GBK");
String s=new String(b,"utf-8");

UTF-8根据数据的头标记来判断向下读几个字节,如果是0,表示读一个。110,10读2个。1110,10,10读三个。
联通因为二进制符合u8的解码形式,所以记事本会使用u8进行解码。出现乱码。