利用jsoup实现网页内容的抓取
来源:互联网 发布:游戏编程模式 中文 pdf 编辑:程序博客网 时间:2024/04/29 10:04
1、下载jsoup相关jar
- 官网:https://jsoup.org/
- 下载地址:http://jsoup.org/packages/jsoup-1.8.1.jar
2、目的
从百度新闻的页面上抓取红色方框里面的内容
3、代码块
import java.io.IOException;import org.jsoup.Jsoup;import org.jsoup.nodes.Document;import org.jsoup.nodes.Element;import org.jsoup.select.Elements;public class TestJsoup { public static void main(String[] args) { try { Document doc = Jsoup.connect("http://news.baidu.com/").get(); Elements elements = doc.select("#pane-news > div > ul > li > strong > a"); for (Element element : elements) { System.out.println(element.text()); } } catch (IOException e) { e.printStackTrace(); } }}
4、运行结果
0 0
- 利用jsoup实现网页内容的抓取
- JSOUP抓取网页内容
- 利用jsoup抓取指定网页的照片【也可以修改一下抓取其他内容】
- Jsoup网页内容抓取分析
- Jsoup网页内容抓取分析
- jsoup网页内容抓取分析
- Jsoup网页内容抓取分析
- java利用url实现网页内容的抓取
- java利用url实现网页内容的抓取
- java利用url实现网页内容的抓取
- java利用url实现网页内容的抓取
- java利用url实现网页内容的抓取
- htmlunit+Jsoup实现网页抓取
- 利用Jsoup解析网页,抓取数据的简单应用
- Jsoup网页内容抓取分析(1)
- Http,Jsoup抓取网页内容-by TomHawk
- 使用Jsoup登录网站抓取网页内容
- 利用Jsoup解析器抓取网页源代码
- LeetCode Problem NO53. Maximum Subarray
- 杭电1004之Let the Balloon Rise
- IOCP技巧
- 为什么计算机时间要从1970年1月1日开始算起
- Android 7.0应用冷启动流程分析
- 利用jsoup实现网页内容的抓取
- Linux 预定义的信号处理函数
- 算法竞赛入门经典 第二版 习题5-8 图书管理系统 Borrowers uva230
- 训练15-HTML 处理多个字体降级
- 怎么判断android中ScrollView滑动到了最底部
- hdu 2087 剪花布条
- Java面向对象
- java中 static 的执行顺序问题
- 通过vmware-tools实现windows与虚拟机上的ubuntu文件共享