java实现针对控制台和文本输入,检测输入中的西文符号

来源:互联网 发布:云南网络党建 编辑:程序博客网 时间:2024/06/18 17:59

针对控制台和文本输入,检测输入中的西文符号。

以下是 unicode 的编码区段。

Roadmap to Unicode BMP-zh.svg

0000-001FC0控制符C0 Controls0020-007F基本拉丁文Basic Latin0080-009FC1控制符C1 Controls00A0-00FF拉丁文补充-1Latin-1 Supplement0100-017F拉丁文扩展-ALatin Extended-A0180-024F拉丁文扩展-BLatin Extended-B所以想要查找到西文字符只要在0020-007F和00A0-024F两个编码区段中比对就行了。代码如下:

public void write( String str ) throws IOException {StringBuilder builder = new StringBuilder();int index = 0;char ch;for ( ; index<str.length(); index++ ) {ch = str.charAt(index);if ( (32<=(int)ch&&(int)ch<=7*16+15) || (160<=(int)ch&&(int)ch<=2*16*16+4*16+15) )continue;builder.append( ch );}System.out.print(builder.toString());}

打开unicode字符集的文本的代码如下:

InputStream in;in = new FileInputStream(scanner.next());reader = new BufferedReader(new InputStreamReader(in, "Unicode"));


ps:如何将txt文本保存为unicode字符集? 将文本另存为,在弹出窗口的最下面一行又选择。

如何查看文本的当前字符集? 尝试进入另存为,默认的字符集就是当前字符集。

0 0