利用jsoup实现网页内容的抓取

来源:互联网 发布:游戏编程模式 中文 pdf 编辑:程序博客网 时间:2024/04/29 10:04

1、下载jsoup相关jar

  • 官网:https://jsoup.org/
  • 下载地址:http://jsoup.org/packages/jsoup-1.8.1.jar

2、目的

从百度新闻的页面上抓取红色方框里面的内容

从百度新闻的页面上抓取红色方框里面的内容

3、代码块

import java.io.IOException;import org.jsoup.Jsoup;import org.jsoup.nodes.Document;import org.jsoup.nodes.Element;import org.jsoup.select.Elements;public class TestJsoup {    public static void main(String[] args) {         try {                Document doc = Jsoup.connect("http://news.baidu.com/").get();                 Elements elements = doc.select("#pane-news > div > ul > li > strong > a");                for (Element element : elements) {                    System.out.println(element.text());                }            } catch (IOException e) {                e.printStackTrace();            }     }}

4、运行结果

这里写图片描述

0 0
原创粉丝点击