HttpClient 流式读取时中文乱码的解决方法

来源:互联网 发布:笔记本连不上公共网络 编辑:程序博客网 时间:2024/04/30 19:19
1、非流式读取
  
  HttpClient中可以之间使用HttpMethod的getResponseBodyAsString()方法获取返回的内容,在读取之前,如果需要做编码设置可以这样:
  
  HttpMethod get=new GetMethod(url);
  httpClient.executeMethod(get);
  get.getParams().setContentCharset("GBK");
  
  这么做虽然可以解决中文乱码问题,但是在HttpClient 3.1中这种方法是不推荐的,会发出警告。
  
  2、流式读取
  
   
  
   HttpClient推荐使用流式的读取返回内容,如下:
  
   
  
  BufferedReader reader=new BufferedReader(new InputStreamReader(get.getResponseBodyAsStream()));
  String tmp=null;
  String htmlRet="";
  while((tmp=reader.readLine())!=null){
   htmlRet+=tmp+"\r\n";
  }
  System.out.println(new String(htmlRet.getBytes(),"GB2312"));
  
  但是经过尝试发现这样会出现中文乱码问题。经过N次实验后,将上面代码修改如下,乱码问题随之解决。
  
  HttpClient httpClient=new HttpClient(); 
  HttpMethod get=new GetMethod(send_url);
  
  try {
   httpClient.executeMethod(get);
  
   //System.out.println(get.getResponseBodyAsString());
  
   BufferedReader reader=new BufferedReader(new InputStreamReader(get.getResponseBodyAsStream(),"ISO-8859-1"));
   String tmp=null;
   String htmlRet=""; 
   while((tmp=reader.readLine())!=null){
   htmlRet+=tmp+"\r\n";
  }
  
  System.out.println(new String(htmlRet.getBytes("ISO-8859-1"),"GB2312"));
  
  } catch (HttpException e) {
   e.printStackTrace();
  } catch (IOException e) {
   e.printStackTrace();
  }finally{
   get.releaseConnection();
  }