计算机编码相关

来源:互联网 发布:java体系结构 编辑:程序博客网 时间:2024/06/06 08:36

联通
ASCII码
C1AACDA8

11000001 10101010
11001101 10101000

UNICODE码
8054901A

10000000
01010100
10010000
00011010

 

1、ASCII码确实是0x00~0x7F,超过的部分,也就是0x80~0xFF为ASCII扩展字符集,对于双字节的编码来说,为了与ASCII字符进行区分,所以高低字节都要在0x80~0xFF范围以内.严格来说,汉字的这种编码不是ASCII编码,准确的说是内码。(百度Hi)

2、U+FEFF转为UTF-8成为3字节,11111110 11111111 ->以6bit为单位由低向高位分割,1111 111011 111111->第一个6位前补齐110,第二,三补上10,就转变为:11101111 10111011 10111111,即EFBBBF。