锦衣卫密信:JYW汉字编码

来源:互联网 发布:js中array转换成json 编辑:程序博客网 时间:2024/04/30 07:28
为了适合短信加密的需要,特别制作了JYW汉字编码。

JYW汉字编码主要是双字节编码,高位字节在0x80~0xEF之间,低位字节在0x01~0xFF之间,一共可以存储32385个汉字。
JYW汉字编码也可以扩展成四字节编码即两组双字节,前一个双字节的高位字节为0xF0,低位字节在0x01~0xFF之间,后一个双字节的高位字节在0xF0~0xFF之间,低位字节在0x01~0xFF之间,一共可以储存10404000个字符。
JYW汉字编码分为常用汉字区和非常用汉字区,常用汉字区的高位字节在0x80~0x8F之间,非常用汉字区的高位字节在0x90~0xEF之间。具体的汉字编码分区和编码顺序,参考GB18030-2005版。

1、常用汉字区:
0x8001~0x805F:单字节字符从0x20~0x7E。
0x8060~0x8081:双字节1区34个符号三个连续区域:高字节为0xA1、低字节分别为0xA1~0xA4、0xAA~0xC5、0xE6~0xE7。
0x8082~0x80DF:双字节1区94个全角符号:高字节为0xA3、低字节为0xA1~0xFE。
0x80E0~0x8F99:双字节2区3755个常用字:高位字节为0xB0~0xD7、低字节为0xA1~0xFE(高字节为0xD7时低字节最大是0xF9)。
0x8F9A~0x8FFF:保留区剩余102个位置。

2、非常用汉字区:
0x9001~0x92D0:双字节1区846个减去上面已经用的128个,共718个。(其中的0x9100、0x9200不要)
0x92D1~0x9EA1:双字节2区3008个非常用字和5个未用空白码等于3013个汉字。(其中的0x9?00不要,共12个)
0x9EA2~0xB679:双字节3区6080个。(其中的0x??00不要,共24个)
0xB67A~0xD679:双字节4区8160个。(其中的0x??00不要,共32个)
0xD67A~0xD73A:双字节5区192个。(其中的0xD700不要)
0xD73B~0xEFFF:保留区剩余6317个位置。(其中的0x??00不要,共24个)

3、四字节扩展区:
0xF001~0xF0FF:保留扩展为4字节编码,用于表示CJK统一汉字扩充库。
0xF101~0xFFFF:保留。


以下是GBK和JYW编码的转换软件,仅供参考: