常用汉字编码

来源:互联网 发布:adobe reader 软件下载 编辑:程序博客网 时间:2024/05/22 02:40

GB2312  

收录简化汉字及符号、字母、日文假名等共 7445 个图形字符,其中汉字占 6763 个。

GB2312码是中华人民共和国国家汉字信息交换用编码,全称《信息交换用汉字编码字符集--基本集》

GB12345

6,866个汉字

 

GB 12345,全称《信息交换用汉字编码字符集 辅助集》(英文:Codeof Chinese ideogram set for information interchange supplementary set),也就是「第一辅助集」,简称 GB1,可以看成是GB2312的繁体版本,共收录6866个汉字,是中国为了适应繁体汉字信息处理而制定的标准。由于不能满足现实需求,所以也不被大多数电脑系统采用。

GB 12345 原稱 GB/T12345-90,於1990年發佈,T 是「推薦」漢語拼音首字母。1993年改為強制性,改稱 GB 12345。

[编辑]编码安排

 

1、第01区到第09区和GB2312基本一样,并增加了6个汉语拼音字符(源自 GB5007.1-85 對 GB2312 之修正)和29个竖排标点。

2、第16区到第87区开始,排列和GB2312相对应的繁体字,如果GB2312中的汉字没有对应的繁体字,则排列和GB2312一样的汉字。

3、第88区到89区,增补了由于汉字简化而被精简的103个汉字。

GBK

 21,003个汉字

GB18030

27,000个汉字

GB18030-2000(GBK2K)在GBK的基础上进一步扩展了汉字,增加了藏、蒙等少数民族的字形。GBK2K从根本上解决了字位不够,字形不足的问题。

Big5

 13,053个汉字

CNS11643

 48,027个汉字

 

中文標準交換碼

维基百科,自由的百科全书

中文標準交換碼,編號CNS 11643,舊名國家標準中文交換碼,是中華民國為資訊交換而制定的標準編碼方案,與CCCII同屬於中文交換碼。

1980年9月行政院國家科學委員會集合國內編碼專家、學者在溪頭舉行會議並達成初步原則,並據此請行政院核定國家中文資訊標準交換碼編碼原則。經過多次會商,在1986年8月4日正式由中央標準局公佈,取名「通用漢字標準交換碼」,簡稱「通用碼」。

當時的內容包括第一字面、第二字面共13,051字,經過多年的使用意見及反映,於1992年擴編至第七字面,共48,027字,並改稱「中文標準交換碼」(CSIC, Chinese Standard Interchange Code)。此後陸續充實內容,1992年版一共十六字面,使用至第七字面;2004年版一共八十字面,使用至第十五字面。

八十年代萬碼奔騰,業界使用各種不同的內碼,如王安碼、IBM 5550碼、電信碼...等等。藉由此國家標準交換碼的公布與使用,做為各種不同內碼間的橋梁,使得不同的內碼也可以互相溝通和交換,資料可共享。

GB2312码是中华人民共和国国家汉字信息交换用编码,全称《信息交换用汉字编码字符集--基本集》

GB12345

6,866个汉字

 

GB 12345,全称《信息交换用汉字编码字符集 辅助集》(英文:Codeof Chinese ideogram set for information interchange supplementary set),也就是「第一辅助集」,简称 GB1,可以看成是GB2312的繁体版本,共收录6866个汉字,是中国为了适应繁体汉字信息处理而制定的标准。由于不能满足现实需求,所以也不被大多数电脑系统采用。

GB 12345 原稱 GB/T12345-90,於1990年發佈,T 是「推薦」漢語拼音首字母。1993年改為強制性,改稱 GB 12345。

[编辑]编码安排

 

1、第01区到第09区和GB2312基本一样,并增加了6个汉语拼音字符(源自 GB5007.1-85 對 GB2312 之修正)和29个竖排标点。

2、第16区到第87区开始,排列和GB2312相对应的繁体字,如果GB2312中的汉字没有对应的繁体字,则排列和GB2312一样的汉字。

3、第88区到89区,增补了由于汉字简化而被精简的103个汉字。

GBK

 21,003个汉字

GBK 共收入 21886 个汉字和图形符号,包括:

 

* GB2312 中的全部汉字、非汉字符号。

* BIG5 中的全部汉字。

* 与 ISO 10646 相应的国家标准GB13000 中的其它 CJK 汉字,以上合计 20902 个汉字。

* 其它汉字、部首、符号,共计 984 个。

GB18030

27,000个汉字

GB18030-2000(GBK2K)在GBK的基础上进一步扩展了汉字,增加了藏、蒙等少数民族的字形。GBK2K从根本上解决了字位不够,字形不足的问题。

Big5

 13,053个汉字

 

BIG5 收录 13461 个汉字和符号,包括:

 

* 符号 408 个,编码位置A140-A3BE

* 常用字 5401 个,编码位置A440-C67E,包括台湾教育部颁布的《常用国字标准字体表》的全部汉字 4808 个,台湾教科书常用字 587 个,异体字 6 个。

* 次常用字 7652 个,编码位置C940-F9D5,包括台湾教育部颁布的《次常用国字标准字体表》的全部汉字 6341 个,《罕用国字标准字体表》中使用频率较高的字 1311 个

CNS11643

 48,027个汉字

 

中文標準交換碼

维基百科,自由的百科全书

中文標準交換碼,編號CNS 11643,舊名國家標準中文交換碼,是中華民國為資訊交換而制定的標準編碼方案,與CCCII同屬於中文交換碼。

1980年9月行政院國家科學委員會集合國內編碼專家、學者在溪頭舉行會議並達成初步原則,並據此請行政院核定國家中文資訊標準交換碼編碼原則。經過多次會商,在1986年8月4日正式由中央標準局公佈,取名「通用漢字標準交換碼」,簡稱「通用碼」。

當時的內容包括第一字面、第二字面共13,051字,經過多年的使用意見及反映,於1992年擴編至第七字面,共48,027字,並改稱「中文標準交換碼」(CSIC, Chinese Standard Interchange Code)。此後陸續充實內容,1992年版一共十六字面,使用至第七字面;2004年版一共八十字面,使用至第十五字面。

八十年代萬碼奔騰,業界使用各種不同的內碼,如王安碼、IBM 5550碼、電信碼...等等。藉由此國家標準交換碼的公布與使用,做為各種不同內碼間的橋梁,使得不同的內碼也可以互相溝通和交換,資料可共享。