使用HttpURLConnection访问web页面

来源:互联网 发布:mac youtube 视频下载 编辑:程序博客网 时间:2024/05/22 03:15

URLConnection类给应用程序和web资源之间架设起了通信的桥梁,这些web资源通常是通过url来标记的,比如http://java.sun.com。本文将讲述如何使用HttpURLConnection来访问web页面。

    URLConnection是个抽象类,它有两个直接子类分别是HttpURLConnection和JarURLConnection。另外一个重要的类是URL,通常URL可以通过传给构造器一个String类型的参数来生成一个指向特定地址的URL实例。比如:

URL url = new URL("http://www.j2medev.com");
URLConnection con = url.openConnection();

    通过上面的语句我们就可以得到一个URLConnection的实例,如果你在后面添加一句话System.out.println(con.getClass())你会得到class sun.net.www.protocol.http.HttpURLConnection 的输出,这证明返回来得con是URLConnection的子类HttpURLConnection实例。如果你的URL的String参数是https://java.sun.com,那么它会打印出class sun.net.www.protocol.https.HttpsURLConnectionImpl。下面我们编写一段程序,通过使用HttpURLConnection访问web页面并把得到的内容打印到控制台。代码如下
   import java.net.URL;
   import java.net.MalformedURLException;
   import java.net.URLConnection;
   import java.io.IOException;
   import java.io.BufferedReader;
   import java.io.InputStreamReader;

   public class WebPageReader {

      private static URLConnection connection;

      private static void connect( String urlString ) {
        try {
          URL url = new URL(urlString);
          connection = url.openConnection();
   System.out.println(connection.getClass());
        } catch (MalformedURLException e){
          e.printStackTrace();
        } catch (IOException e) {
          e.printStackTrace();
        }
      }

      private static void readContents() {
        BufferedReader in = null;
        try {
          in = new BufferedReader(
            new InputStreamReader(
              connection.getInputStream()));

          String inputLine;
          while (
            (inputLine = in.readLine()) != null) {
            System.out.println(inputLine);
          }
        } catch (IOException e) {
          e.printStackTrace();
        }
      }

      public static void main(String[] args) {
        if (args.length != 1) {
          System.err.println("usage: java WebPageReader "
                                             + "<url>");
          System.exit(0);
        }
        connect(args[0]);
        readContents();
      }
   }
    我们编译这个代码并执行
javac WebPageReader.java
java WebPageReader http://localhost  你可以从控制台看到他把页面的内容。

    如果你使用代理访问外面的网络的话可以在程序中添加上下面的代码
    System.getProperties().put("proxySet", "true");
    System.getProperties().put("proxyHost", "10.154.134.110");
    System.getProperties().put("proxyPort", "8080");

    下面简单的介绍一下重定向的问题,当你访问某个URL的时候,Server可能会把你重新定向到另外一个地址,我们可以用程序看看这个问题是怎么发生的。我们准备一个简单的asp页面位于http://localhost/test/redirect.asp,内容如下
<%
response.redirect("http://localhost")
%>
当访问他的时候他会把你定向到http://localhost 的地址去。
   import java.net.URL;
   import java.net.MalformedURLException;
   import java.net.HttpURLConnection;
   import java.io.IOException;

   public class RedirectingReader {

      private static HttpURLConnection connection;

      private static void connect( String urlString ) {
        try {
          URL url = new URL(urlString);
          connection
              = (HttpURLConnection)url.openConnection();
          System.out.println(connection.getURL());
          System.out.println(
              connection.getResponseCode() +
              " " + connection.getResponseMessage());
          System.out.println(connection.getURL());
        } catch (MalformedURLException e){
          e.printStackTrace();
        } catch (IOException e) {
          e.printStackTrace();
        }
      }

      public static void main(String[] args) {
        if (args.length != 1) {
          System.err.println(
               "usage: java WebPageReader "
               + "<url>");
          System.exit(0);
        }
        connect(args[0]);
      }
   }
编译程序并执行
javac RedirectingReader.java
java RedirectingReader http://localhost/test/redirect.asp
可以得到输出为
http://localhost/test/redirect.asp
200 OK
http://localhost/localstart.asp