C++ 自然语言编码问题

来源:互联网 发布:美工刀片价格 编辑:程序博客网 时间:2024/04/28 08:07
  1. 一般地,两个字节为单位就可以表示任何语言,unicode就是这样做的。
  2. 汉字占两个字节,英文字母占一个字节,汉字的高位字节为负数
  3. utf8编码中,一个字的字节可以是1,2,3个字节不等