Java运行JS库 -- Jsoup
来源:互联网 发布:sai是什么软件 编辑:程序博客网 时间:2024/06/15 04:30
import java.io.IOException;
import java.net.MalformedURLException;
import java.net.URL;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
import org.junit.Test;
public class JsoupParseHtml {
/**
* Jsoup1.*版本
*/
@Test
public void JsoupParse() {
try {
URL url = new URL("http://www.baidu.com");
Document document = Jsoup.parse(url, 5000);
System.out.println(document.getElementById("form1").html());
// System.out.println(document.select("#form1").html());
/*Elements elist = document.select("#form1 input[type=hidden]");
for (Element element : elist) {
System.out.println(element.val());
}*/
} catch (MalformedURLException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
}
@Test
public void JsoupParseBy2_9_1() {
try {
String url = "http://www.baidu.com";
Document document = Jsoup.connect(url).userAgent("Mozilla").get(); // 处理首页
// Document document = Jsoup.connect(url).userAgent("Chrome").get(); // 处理首页
Elements htmls = document.select(".bg");
// System.out.println(document.getElementById("form1").html());
String html = "";
for (Element element : htmls) {
html = element.val();
System.out.println(html);
}
} catch (IOException e) {
e.printStackTrace();
}
}
}
-- 代码中引入的jar为jsoup1.7.2.jar- Java运行JS库 -- Jsoup
- JAVA jsoup
- JSoup入门笔记--------java HTML 解析库
- Jsoup入门-java
- java解析XML--jsoup
- java jsoup 网络爬虫
- java jsoup调用
- JAVA Jsoup 基本操作
- Java爬虫之Jsoup
- java爬虫:JSOUP
- Java HTML 解析器:jsoup
- java 网页解析工具包 Jsoup
- java 网页解析工具包 Jsoup
- java 网页解析工具包 Jsoup
- jsoup: Java HTML 解析器
- java利用JSOUP解析html
- Java使用Jsoup解析网页
- java jsoup解析html实例
- 设计模式学习(二)——抽象工厂模式
- Failing over to RSL framework_4.6.0.23201.swz
- 编译器编译main.cpp
- Objective-c的内存管理MRC与ARC
- Linux 查看进程和删除进程
- Java运行JS库 -- Jsoup
- Linux下常用SVN命令
- 文件的文件夹
- android获取屏幕的宽、高
- linux的宏__user
- java读写xml文件
- freemarker教程
- 一切不以Eng 抑或 官网 reference 为参考的 例子都是扯淡
- Node Jade模板引擎