Jsoup解析HTML Demo

来源:互联网 发布:python字典遍历 编辑:程序博客网 时间:2024/05/12 00:41

    这里给个小例子,目的是从下文中抽取出标题,大家可以看一下他的类jQuery语法。

  1. <div class="artHead">  
  2.   <div>  
  3.   
  4.     <span class="artType01" style="margin-right: 5px;"><a href="javascript:void(0)">原创</a></span>  
  5.   
  6.   <h3 class="artTitle"><a href="/2431658/483361">JAVA程序内存溢出问题的分析</a>  
  7.   
  8.   <a href="http://blog.51cto.com/artcommend" target="_blank"><img src="http://blog.51cto.com/image/skin/34/indextj.gif" width="15" height="15" /></a>  
  9.   
  10.   
  11.   </h3>  
  12.   </div>  

 

    这个内容是从我博客首页上摘取的,所以直接打开这个页面进行抽取,测试代码如下:

  1. package jsoup; 
  2.  
  3. import java.io.IOException; 
  4. import org.jsoup.Jsoup; 
  5. import org.jsoup.nodes.Document; 
  6. import org.jsoup.select.Elements; 
  7.  
  8. public class ParseTest { 
  9.  
  10.     public static void main(String[] args) { 
  11.         try { 
  12.             Document doc = Jsoup.connect("http://passover.blog.51cto.com/").get(); 
  13.             System.out.println(doc.title()); 
  14.             Elements eles = doc.select("div.artHead"); 
  15.             System.out.println(eles.first().select("h3[class=artTitle]")); 
  16.         } catch (IOException e) { 
  17.             e.printStackTrace(); 
  18.         } 
  19.     } 
  20.  
原创粉丝点击