解决URL中有中文的问题,可以放心使用url.opnestream方法

来源:互联网 发布:网络购彩新闻 编辑:程序博客网 时间:2024/05/08 20:17
最近在做一个用POI提取excel文件内容的例子。 
如果所提取的文件放在网络上。就需要用URL来打开该文件获得InputStream; 

URL url = new URL("http://192.168.1.1:8080/resources/电话.xls"); 
InputStream in = url.openStream(); 
这样会报错 

如果 
URL url = new URL("http://192.168.1.1:8080/resources/1.xls"); 
InputStream in = url.openStream(); 
就不会有问题。 

我用的服务器是Tomcat。

程序测试时的源码 

URL url = new URL("http://192.168.1.110:8080/resources/电话.xls"); 
InputStream in = url.openStream(); 
POIFSFileSystem pfs = new POIFSFileSystem(in); 
HSSFWorkbook wb = new HSSFWorkbook(pfs); 
ExcelExtractor extractor = new ExcelExtractor(wb); 

extractor.setFormulasNotResults(true); 
extractor.setIncludeSheetNames(false); 
String text = extractor.getText(); 
System.out.println(text); 


经过在论坛上发帖子,各路高手的帮忙,终于解决了这个问题,等知道答案后觉得这个挺简单的
只要写一个类 把URL中的中文转码就行了
package gameover;import java.io.UnsupportedEncodingException;import java.net.URLEncoder;import java.util.regex.Matcher;import java.util.regex.Pattern;/** * 正则替换字符串里面的汉字部分。 * * @author gameover */public class URLEncoderHZ { public static void main(String[] args) throws Exception { String str = "http://192.168.1.1:8080/resources/电话.xls"; System.out.println(encode(str, "UTF-8")); } private static String zhPattern = "[/u4e00-/u9fa5]+"; /** * 替换字符串卷 * * @param str 被替换的字符串 * @param charset 字符集 * @return 替换好的 * @throws UnsupportedEncodingException 不支持的字符集 */ public static String encode(String str, String charset) throws UnsupportedEncodingException { Pattern p = Pattern.compile(zhPattern); Matcher m = p.matcher(str); StringBuffer b = new StringBuffer(); while (m.find()) { m.appendReplacement(b, URLEncoder.encode(m.group(0), charset)); } m.appendTail(b); return b.toString(); }}


比如例子中的url
http://192.168.1.1:8080/resources/电话.xls
经过这个类中的方法转成utf-8编码后就变成了
http://192.168.1.1:8080/resources/%E7%94%B5%E8%AF%9D.xls 
当然也可以根据需要转成其他编码格式。
这样就可以放心的使用url.openstream这个方法的得到InputStream对象了
不会再报错文件找不到。

原创粉丝点击