JSP“抓”网页代码的程序

来源:互联网 发布:Linux安装telnet yum 编辑:程序博客网 时间:2024/05/22 19:57
JSP“抓”网页代码的程序如下:
java 代码
  1. <%@ page contentType="text/html;charset=gb2312"%>    
  2. <%    
  3. String sCurrentLine;    
  4. String sTotalString;    
  5. sCurrentLine="";    
  6. sTotalString="";    
  7. java.io.InputStream l_urlStream;    
  8. java.net.URL l_url = new java.net.URL("http://www.163.net/");    
  9. java.net.HttpURLConnection l_connection = (java.net.HttpURLConnection) l_url.openConnection();   
  10. l_connection.connect();    
  11. l_urlStream = l_connection.getInputStream();    
  12. java.io.BufferedReader l_reader = new java.io.BufferedReader(new java.io.InputStreamReader(l_urlStream));    
  13. while ((sCurrentLine = l_reader.readLine()) != null)    
  14. {    
  15. sTotalString+=sCurrentLine;    
  16. }    
  17. out.println(sTotalString);    
  18. %>    

后记

  虽然代码比较简单,但是,我认为根据这个,可以实现“网络爬虫”的功能,比如从页面找href连接,然后再得到那个连接,然后再“抓”,不停止地(当然可以限定层数),这样,可以实现“网页搜索”功能。

0 0
原创粉丝点击