Jsoup之网络爬虫
来源:互联网 发布:杭州规划美工设计招聘 编辑:程序博客网 时间:2024/05/17 17:54
使用Jsoup进行简单的批量抓取网页图片。
package com.wh.web;import com.wh.util.HttpUtil;import org.jsoup.nodes.Document;import org.jsoup.nodes.Element;import org.jsoup.select.Elements;import java.io.IOException;/** * Created by John on 2017/7/21. * 使用Jsoup实现简单的网络爬虫 */public class Jsoup { public static void main(String[] args) throws IOException { Document document = org.jsoup.Jsoup.connect("http://www.mm131.com/qingchun/").get(); Elements elements = document.select(".main .list-left dd:not(.page)>a"); for (Element ele:elements) { String href = ele.attr("href"); System.out.println(href); Elements img = ele.select("img"); String imgSrc = img.attr("src"); System.out.println(imgSrc); String title = ele.text(); System.out.println(title); HttpUtil.getRequestStream(imgSrc,"H:/upload/" + title + ".jpg"); } }}
package com.kaishengit.test;import com.kaishengit.util.HttpUtil;import org.jsoup.Jsoup;import org.jsoup.nodes.Document;import org.jsoup.nodes.Element;import org.jsoup.select.Elements;import org.junit.Test;import java.io.IOException;public class JSoupTestCase { @Test public void testGetImage() throws IOException { for(int i = 2;i < 5;i++) { Document document = Jsoup.connect("http://www.topit.me/pop?p="+i).cookie("is_click", "1").get(); Elements elements = document.select("#content .catalog .e>a"); for (Element element : elements) { String href = element.attr("href"); System.out.println("href:" + href); Document bigImageDoc = Jsoup.connect(href).cookie("is_click", "1").get(); Element imgElement = bigImageDoc.select("#content>a").first(); String imgSrc = imgElement.attr("href"); String fileName = imgSrc.substring(imgSrc.lastIndexOf("/") + 1); System.out.println(imgSrc); HttpUtil.getRequestStream(imgSrc, "D:/upload/" + fileName); } } }}
阅读全文
0 0
- Jsoup之网络爬虫
- Jsoup网络爬虫
- java jsoup 网络爬虫
- htmluinit+jsoup 网络爬虫
- Java爬虫之Jsoup
- Android爬虫之Jsoup
- Jsoup做的网络爬虫
- jsoup 的用法网络爬虫
- Jsoup 网络爬虫 学习例子
- 使用JSOUP实现网络爬虫
- Jsoup 爬虫 抓取网络图片
- Jsoup -- 网络爬虫解析器
- 使用JSOUP实现网络爬虫
- 爬虫之jsoup入门指南
- 【使用JSOUP实现网络爬虫】处理URLs
- 网络爬虫利器:fiddle+httpclient+jsoup
- Android客户端网络爬虫jsoup原理
- Android网络爬虫程序(基于Jsoup)
- 为什么楼盘销售员 都推荐顾客买7层的楼房?
- loft楼梯如何设计 必看的楼梯风水禁忌
- window、linux 命令大全
- ListView
- 今日头条一面笔试面试题!!!!!完整
- Jsoup之网络爬虫
- 1426 [kuangbin带你飞]专题一 简单搜索 E
- 别只关注地段、户型 楼盘隐形品质不能忽视
- iOS学习笔记-082.音乐震动条
- Codeforces Round 22 C. The Tag Game ( 搜索
- socket I/O上设置超时的三种方法及其比较
- 根据IP进行城市定位
- Xamarin Android 笔记
- jsp利用pol通过servlet来实现Excel导入数据库