GB2312汉字区位码、交换码和机内码
来源:互联网 发布:linux泛文件 编辑:程序博客网 时间:2024/05/16 11:24
1981年国家颁布了GB2312汉字标准共有6763个,其中一级3755,二级3008,还有682非汉字字符。并为每个字符规定了标准编码,便于在计算机内部相互转换。
作为GB2312标准只是定义了一张94×94的二维表。其中行为区号,列为位号。这样可以利用区号和位号来找到其中的汉字。这种编码就是我们所说的区位码。
比如
陈(1934) 区号:19 位号:34,为了处理与存储的方便,每个汉字的区号和位号在计算机内部分别用一个字节来表示
区位码无法于汉字进行通信,因为ASCII码中规定了OOH-1F作为控制码使用,这样就发生了冲突。由于计算机不是中国人发明的所以只能听从于国际标准ISO2022规定区号和位号都加上32,这样就防止冲突。经过加上32以后的编码称为国际交换码
陈-区号:19+32= 51
00010011+00100000=00110011
位号:34+32=66
00100010+00100000=01000010
即5166 16进制3342
由于文本中通常混合使用汉字和西文字符,汉字信息如果不予以特别标识,就会与单字节的ASCII码混淆。此问题的解决方法之一是将一个汉字看成是两个扩展ASCII码,使表示GB2312汉字的两个字节的最高位都为1。
这种高位为1的双字节汉字编码即为GB2312汉字的机内码,简称为内码。
00110011最高位变为1则从33变为B3
01000010最高位变为1则从42变为C2
这样一来,陈的机内码应该为B3C2
这里要说明的是不管你是采用什么样的输入法输入汉字,其汉字的机内码都是相同的。
如果要从一个汉字的机内码转换为区位码,其实就是相反的方向进行运算。
- GB2312汉字区位码、交换码和机内码
- GB2312汉字区位码、交换码和机内码
- GB2312汉字区位码、交换码和机内码转换方法 (ZT)
- GB2312汉字区位码、交换码和机内码转换方法 (ZT)
- 汉字交换码和机内码
- 汉字的内码和区位码与显示汉字原理
- 汉字的内码和区位码与显示汉字原理
- 机内码和区位码关系
- C语言 获取汉字机内码、区位码、国际码
- Qt 汉字内码及区位码 提取
- 汉字区位码--特殊字符--GB2312
- 汉字的区位码,内码是一回事吗
- 区位码、国标码与机内码
- 区位码、国标码与机内码
- 区位码 国际码 机内码 转换
- 机内码、国际码、区位码换算
- 区位码、国标码、机内码
- 区位码、国标码、机内码、GBK
- NVIDIA芯片故障(G84和G86系列)影响到1800万台笔记本
- xp_cmdshell,Transact-SQL中常用扩展存储过程
- C++ 类成员引用变量的使用
- dos命令大全
- 使用新型D-BUS与桌面应用程序通讯
- GB2312汉字区位码、交换码和机内码
- 关于类似QQ界面隐藏的问题
- c# 汉语拼音排序函数
- gpephone之dbus分析(1)
- 深度迅雷5.8.3.556无广告绿色超级精简版【迅雷6核心文件】-绿软下载
- 卡巴斯基破解版 KISV8.0.0.432 Beta 江南混混汉化特别版
- 如何关联,打开文件?
- 名家CODEGEAR DELPHI 文章BLOG
- 图片减肥