unicode到utf-8的转换

来源:互联网 发布:地面互动投影软件 编辑:程序博客网 时间:2024/05/14 10:32

Unicode 
  UTF-8 
   
  0000 - 007F 
  0xxxxxxx 
   
  0080 - 07FF 
  110xxxxx 10xxxxxx 
   
  0800 - FFFF  
  1110xxxx 10xxxxxx 10xxxxxx 

例如"汉"字的Unicode编码是6C49。6C49在0800-FFFF之间,所以要用3字节模板:1110xxxx 10xxxxxx 10xxxxxx。将6C49写成二进制是:0110 1100 0100 1001,将这个比特流按三字节模板的分段方法分为0110 110001 001001,依次代替模板中的x,得到:1110-0110 10-110001 10-001001,即E6B189,这就是其UTF8的编码。
  

0 0
原创粉丝点击