获取页面内容

来源:互联网 发布:淘宝客活动广场有用吗 编辑:程序博客网 时间:2024/06/07 07:04

package util;  
      
import java.io.BufferedInputStream;  
import java.io.InputStream;  
import java.io.InputStreamReader;  
import java.io.Reader;  
import java.net.HttpURLConnection;  
import java.net.URL;  
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
      
public class GetHTMLByURL {  
    //url:网页链接   code:网页编码
    public static Document cc(String url,String code) {  
        StringBuffer temp = new StringBuffer();  
        try {  
        HttpURLConnection uc = (HttpURLConnection)new URL(url).openConnection();
        uc.setRequestProperty("User-Agent", "Mozilla/4.0 (compatible; MSIE 5.0; Windows NT; DigExt)");
        uc.setConnectTimeout(10000);  
        uc.setDoOutput(true);  
        uc.setRequestMethod("GET");
        uc.setUseCaches(false);  
        InputStream in = new BufferedInputStream(uc.getInputStream());  
        Reader rd = new InputStreamReader(in, code);  
        int i = 0;  
        while ((i = rd.read()) != -1) {  
        temp.append((char) i);  
        }  
        in.close();  
      
         } catch (Exception e) {  
                e.printStackTrace();  
         }  
         return Jsoup.parse(temp.toString());  
    }      
 }  

0 0