有关汉字字符标准的说明
来源:互联网 发布:显卡专业测试软件 编辑:程序博客网 时间:2024/05/19 17:07
有关汉字字符标准的说明
GB2312编码大约包含6000多汉字(不包括特殊字符),编码范围为第一位b0-f7,第二位编码范围为a1-fe(第一位为cf时,第二位为a1-d3),计算一下汉字个数为6762个汉字。当然还有其他的字符。包括控制键和其他字符大约7573个字符编码gbk编码是对gb2312编码的扩充,容纳的汉字更多,但仅仅是扩充,没有质的变化。保留了所有gb2312编码,在此基础上进行编码范围的扩充.容纳(包含特殊字符)共22014个字符编码.
gb18030编码是在gbk编码基础上的扩充,因为汉字更多,仅仅使用两位编码已经不能
容纳要求的汉字,所以采用了24位混和的办法,可以支持更多的汉字编码。并且保留了原有的gbk 2字节编码兼容gb2312和gbk编码的文件。大概容纳55657个编码(包含特殊字符)unicode编码(也就是UTF编码):俗称万国码,致力于使用统一的编码准则表达各国的文字。
为表达更多的文字,utf-8采用2/3混编的方式。目前容纳的汉字范围小于gbk编码。并且以3字节的方式处理中文,带来了兼容性的问题,原有的gbk,gb2312,gb18030编码文件都不能正常的处理,还有很长的路要走。
GB2312编码大约包含6000多汉字(不包括特殊字符),编码范围为第一位b0-f7,第二位编码范围为a1-fe(第一位为cf时,第二位为a1-d3),计算一下汉字个数为6762个汉字。当然还有其他的字符。包括控制键和其他字符大约7573个字符编码gbk编码是对gb2312编码的扩充,容纳的汉字更多,但仅仅是扩充,没有质的变化。保留了所有gb2312编码,在此基础上进行编码范围的扩充.容纳(包含特殊字符)共22014个字符编码.
gb18030编码是在gbk编码基础上的扩充,因为汉字更多,仅仅使用两位编码已经不能
容纳要求的汉字,所以采用了24位混和的办法,可以支持更多的汉字编码。并且保留了原有的gbk 2字节编码兼容gb2312和gbk编码的文件。大概容纳55657个编码(包含特殊字符)unicode编码(也就是UTF编码):俗称万国码,致力于使用统一的编码准则表达各国的文字。
为表达更多的文字,utf-8采用2/3混编的方式。目前容纳的汉字范围小于gbk编码。并且以3字节的方式处理中文,带来了兼容性的问题,原有的gbk,gb2312,gb18030编码文件都不能正常的处理,还有很长的路要走。
Trackback: http://tb.blog.csdn.net/TrackBack.aspx?PostId=591438
- 有关汉字字符标准的说明
- 有关汉字字符标准的说明
- TFTLCD的图片以及汉字字符显示说明
- TFTLCD的图片以及汉字字符显示说明
- 汉字 字符的区别
- 有关KernelRelocate的说明
- 有关volatile的说明
- 有关字符的检验
- 有关于application/x-www-form-urlencoded等字符编码的解释说明
- 生成随机的汉字字符
- 关于汉字字符的截取
- 关于 汉字 字符的判断
- 对汉字字符的统计
- XML CDATA的有关说明
- 有关 TDataLink 的说明文件
- 有关 TDataLink 的说明文件
- 有关DataAdapter对象的说明
- 有关 TDataLink 的说明文件
- JDBC事务优化
- 通过JDBC连接Oracle数据库中的十大技巧
- 求助Hibernate问题(我使用Criteria 查询数据库表时,当客户端调用到第3次就出现问题 )
- Java 编程之实现文件或目录的解压.
- 你的进程使用了多少内存?
- 有关汉字字符标准的说明
- 阿翔编程学-WebSphere下开发WebService服务
- Kernel#puts
- datagrid的增删查改 aspx.cs部分代码
- 写程序到底需不需要懂数学?
- 宿骆氏亭寄怀崔雍崔衮
- js倒记时程序
- 经典身份证代码
- 111