java字节流处理汉字

来源：互联网发布：快手直播配音软件编辑：程序博客网时间：2024/05/21 18:45

今天在学习字节流读取数据，发现返回的是int类型（具体原因可以百度，挺简单的），发现这种情况下是读不了汉字的，但是又转念一想，汉字无非就是两个字节，读两次，然后自己处理一下，未尝不可，于是就产生了这篇博客。

刚开始，总是不成功，后来，想到可能是记事本编码问题的原因，改记事本文件编码格式为unicode，再次运行程序。

先贴一下代码：

public class FileputStream {public static void main(String[] args) throws Exception {File file = new File("d:/a/e.txt");FileInputStream in = new FileInputStream(file);char ch = '一';System.out.println("汉字："+(int)ch);fun((int)ch);ch = '二';System.out.println("汉字："+(int)ch);fun((int)ch);int temp;while((temp=in.read())!=-1){System.out.println("字节"+temp);fun(temp);}in.close();}static void fun(int x){while(x>0){System.out.print(x % 2);x = x/2;}System.out.println("\n");}}

运行结果：

汉字：19968
000000000111001

汉字：20108
001100010111001

字节255
11111111

字节254
01111111

字节0

字节78
0111001

字节140
00110001

字节78
0111001

可见，除了开头有两个标志性的字节，后面的内容已经读了出来，现在就该把读出来的字节处理一下，转成char类型。（记事本里面的内容为“一二”）

代码如下：

public class FileputStream {public static void main(String[] args) throws Exception {File file = new File("d:/a/e.txt");FileInputStream in = new FileInputStream(file);int temp1;int temp2;in.skip(2);while((temp1=in.read())!=-1 & (temp2=in.read())!=-1){temp1 = (temp2<<8) + temp1;System.out.println((char)temp1);}in.close();}}

运行结果为：

一
二
总结：最关键的一点是，一定要把txt文件改成unicode编码格式，不过这样会造成前面多两个无用的字节（对，这两个字节就是因为unicode编码格式才会出来的，其他的编码格式不清楚，反正anis编码格式是不会出现这种情况的）。

阅读全文

0 0