Java爬取有道图片
来源:互联网 发布:黑帮之地mac 编辑:程序博客网 时间:2024/05/16 19:27
这里利用了Jsoup。下载地址如下:
jsoup:下载地址
导入jar包的步骤我就不多说了。
废话不多说,直接上代码。
/** * Created by Aiden on 2015/12/9. */import org.jsoup.Jsoup;import org.jsoup.nodes.Document;import org.jsoup.nodes.Element;import org.jsoup.select.Elements;import java.io.File;import java.io.FileWriter;import java.io.IOException;// 爬取有道图片public class doYoudao { public synchronized static void Geturl(String key, int max) { // key为关键词 FileWriter fileWriter = null; try { fileWriter = new FileWriter(new File("img.txt")); // 写入文件 } catch (IOException e) { e.printStackTrace(); } String keyfrom = "&keyfrom=image.page"; String start = "&start="; int page = 1; while (page < max + 1) { // 爬取 String keyword = Urlbase.youdao + key + keyfrom + page + start + (page - 1) * 24; // 链接 page++; try { Document doc = Jsoup.connect(keyword).get(); // 得到源码 Elements divs = doc.getElementsByTag("div"); // 得到div Elements tables = null; for (Element ele : divs) { try { tables = ele.select("table"); // 得到table标签 for (Element table : tables) { try { Element tbody = table.select("tbody").first(); Element tr = tbody.select("tr").first(); Element td = tr.select("td").first(); Element ul = td.select("ul").first(); Element li = ul.select("li").first(); Element span = li.select("span").first(); Element center = span.select("center").first(); Element img = center.select("img").first(); String src = img.attr("src").toString(); // 得到图片路径 if (ImageUrl.img.contains(src) == false) { fileWriter.write(src + "\n"); } } catch (Exception e) { continue; } } } catch (Exception e) { continue; } } } catch (IOException e) { e.printStackTrace(); continue; } } System.out.println("有道爬取完毕"); try { fileWriter.close(); } catch (IOException e) { e.printStackTrace(); } }}
1 1
- Java爬取有道图片
- Java爬取百度图片
- java爬取百度图片
- Java爬取网页图片
- linux 有道 取词
- java爬虫爬取百度图片
- Java爬虫爬取网站图片
- java爬虫爬取美女图片
- 使用JAVA爬取网页图片
- 有道2.1,多了好多参数,爬取失败...
- python爬取有道翻译出错 {‘errorcode’:50}
- Java取图片文件像素
- Python爬取图片
- Python爬取图片
- 爬取网页图片
- Python3爬取图片
- Scrapy爬取图片
- 简单爬取图片
- 和风天气-城市ID-sqlite数据库构建
- 异步并发保持数据一致性
- 黑马程序员——集合的特殊功能之迭代器
- QT实现文件查找显示列表功能
- 做好SEO排名其实不难
- Java爬取有道图片
- 黑马程序员——集合的特殊功能之HashSet集合如何保证元素的唯一性
- 音频
- 黑马程序员——集合的特殊功能之TreeSet集合如何保证元素的唯一及排序的
- iOS开发屏幕旋转锁定横竖屏解决方法
- QT实现文本编辑器软件
- [hdu1890 Robotic Sort]Splay Tree
- ARC兼容 非ARC的类
- 使用Volley实现Https请求, Volley SSL 双向自认证证书请求。