国标码(GB2312)的自动生成
来源:互联网 发布:计算机2级c语言真题 编辑:程序博客网 时间:2024/05/04 06:15
前面已提到,汉字是由两个字节构成的,每个字节占八位(8bits),那么每个汉字需要占十六位(16bits).而且由于中文字符的每个字节的最高位为1,则每个字节的ASCII码均大于127(27-1).这是中文处理问题的基础.本文研究的是国标码(GB2312-80),即信息交换用汉字编码字符集---基本集.国标码字符的两个字节的ASCII码都是161--254之间的整数.根据这些信息,我们可以很方便的处理涉及国标码的有关程序问题.
我用java程序实现了由机器自动生成国标码.其基本思想是用循环产生每个字节的ASCII码,然后连接两个字节的字符串,再以文本形式输出到二进制文件中.代码如下:
import java.io.*;
public class GB2312_80 {
public static void main(String args[]) throws IOException{
File newDir=new File("d://java//test2");
File newFile=new File(newDir,"GB2312_80.chr");
if (!newFile.exists()){
newFile.createNewFile();
};
RandomAccessFile newFileW=new RandomAccessFile(newFile,"rw");
int i,j;
for(i=161;i<255;i++)
for (j=161;j<255;j++)
{
String m1=Integer.toString(i,2);//将ASCII码值(十进制)转换为二进制字符串
String n1=Integer.toString(j, 2);
String x=m1+n1;//连接两个字符串使之变为16位的字符串(即两个字节)
long x1=Long.parseLong(x, 2);//将字符串转换为长整型数据
newFileW.writeLong(x1);//输出字符.
}
}
}
- 国标码(GB2312)的自动生成
- GB2312-80国标码的一部分
- 国标码
- GBK/GB2312编码问题分析以及java获取汉字国标码
- 如何随机生成指定数目的国标汉字?
- 汉字编码--区位码、国标码、机内码的关系(随机生成汉字时查到的文章)
- DataSet生成gb2312编码的xml
- 国标码简介
- 国标码转UTF8
- 汉字的国标码和机内码是怎么回事?
- 国标的新计分原则
- 国标码与区位码
- 区位码,国标码,内码
- 国标2312转换UCS2码
- ios GBK国标转码
- C# 获取文本文件的编码,自动区分GB2312和UTF8
- C#获取文本文件的编码,自动区分GB2312和UTF8
- C# 获取文本文件的编码,自动区分GB2312和UTF8
- 金融服务公司State Street:IT治理是成功收购的决定性力量
- ASP.NET分页控检BATE版发布
- 上传文件,制作缩略图的心得
- 打工or创业
- 利用Java的Properties类读取配置文件信息
- 国标码(GB2312)的自动生成
- WinForm设计之配置文件
- asp.net2.0中2种读取web.config数据库连接字符串
- Hql语句注意事项总结
- 在ASPX页面中输出XML
- linux内核IOCTL网络控制框架实现分析
- jspSmartUpload上传下载全攻略
- Asp.NET(c#)DataGrid鼠标悬停项改变颜色,移除恢复
- 一个简单实用的分页控件