字符集

来源:互联网 发布:奥数优化训练22讲 编辑:程序博客网 时间:2024/06/10 23:25

字符集简介

字符集顾名思义就是多个字符的集合,这些字符包括包括:各国家文字、标点符号、图形符号、数字等。常见字符集名称:ASCII字符集、GB2312字符集、BIG5字符集、
GB18030字符集、Unicode字符集等。

ASCLL 字符集

//ASCLL字符集共包含255个字符,它也是我们编程最先接触的字符集

UTF字符集

有ISO组织制定出的标准字符集,有UTF-8,UTF-16,UTF-32三套字符集组成。UTF是一个大的标准,它包括了全世界所有的字符。之所以 分为三部分,是因为如果每个字符都用32bit表示会空间造成浪费。
UTF的0~255和ASCLL是重叠的

  • UTF-8
//表示字符的最小单位就是8bit 可变长, 最少8bit, 多了可以再占用//多用于网络传输,因为它可以进行字符压缩,表示的字符编码超过8位占多少就是多少(可变长),不超过8位就用8位表示。
  • UTF-16
//表示字符的最小单位就是16bit 可变长, 最少16bit, 多了可以在占用//Windows从VISTA开始开始使用UTF-16。//用wchar_t用来装UTF-16最好。
  • UTF-32
//表示字符的最小单位就是32bit 可变长, 最少32bit, 多了可以在占用
0 0