java爬虫-Jsoup01
来源:互联网 发布:java 当前时间转整型 编辑:程序博客网 时间:2024/06/05 19:08
工具包:Jsoup.jar http://pan.baidu.com/s/1jIlkMpC
package com.dx.util;
import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStream;
import java.io.InputStreamReader;
import java.net.URL;
import java.net.URLConnection;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
public class CrawlerUtil {
public static void main(String[] args) {
//网址
String url = "http://v.baidu.com/";
try {
//获取文本对象
Document dom = Jsoup.parse(new URL(url), 3000);
//获取标题
System.out.println(dom.title());
//获取超链接(根据标签名)
Elements es1 = dom.getElementsByTag("a");
for(Element e:es1){
System.out.println(e.outerHtml());
}
//根据className获取(能点击的元素无法找到)
Elements es2 = dom.getElementsByClass("index-right-top");
for(Element e:es2){
System.out.println(e.outerHtml());
}
//获取单个元素(根据Id获取)
Element e_class = dom.getElementById("userbar");
System.out.println(e_class);
} catch (Exception e) {
e.printStackTrace();
}
}
}
0 0
- java爬虫-Jsoup01
- JS爬虫,Java爬虫
- JAVA爬虫
- Java 爬虫
- Java 爬虫
- Java 爬虫
- java爬虫
- java 爬虫
- Java爬虫
- java爬虫
- Java爬虫
- java 爬虫
- java爬虫
- java爬虫
- java 爬虫
- java爬虫
- java爬虫
- Java爬虫
- 详解AndroidStudio中使用GsonFormat(附图)
- 深拷贝和浅拷贝
- 安卓学习之-ActivityManager
- JavaScript案例学习8–定时器的使用
- strtoul函数的使用
- java爬虫-Jsoup01
- VELT-0.2.8对STM32开发的支持(4):链接与调试
- Acitivity和Service之间消息的传递
- ES-Hadoop学习笔记-初识
- GDI-图形设备接口
- Objective-C学习笔记-NSString
- Java NIO 系列:Java NIO Path
- 身为网络编辑,你知道这些SEO技巧吗?
- bzoj4562【HAOI2016】食物链