使用Jsoup抓取页面的数据
来源:互联网 发布:银行内控优化心得体会 编辑:程序博客网 时间:2024/05/16 07:15
package test;
import java.io.IOException;
import org.jsoup.Connection;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.select.Elements;
public class Test {
@org.junit.Test
public void getDatasByCssQueryUserBaidu() {
try {
parseRequestUrl("http://www.xicidaili.com/nt");
} catch (IOException e) {
e.printStackTrace();
}
}
public static void parseRequestUrl(String url) throws IOException {
Connection con = Jsoup.connect(url); // 获取请求连接
// 浏览器可接受的MIME类型。
con.header("User-Agent",
"Mozilla/5.0 (Windows NT 6.1; WOW64; rv:45.0) Gecko/20100101 Firefox/45.0");
Document doc = con.get();
Elements tds = doc.getElementsByTag("td");
for (int i = 0; i < tds.size(); i++) {
String linkText = tds.get(i).text();
if (linkText.indexOf(".") > 0) {
System.out.println("========" + linkText);
String port = tds.get(i+1).text();
System.out.println("-----------------"+port);
}
}
}
import java.io.IOException;
import org.jsoup.Connection;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.select.Elements;
public class Test {
@org.junit.Test
public void getDatasByCssQueryUserBaidu() {
try {
parseRequestUrl("http://www.xicidaili.com/nt");
} catch (IOException e) {
e.printStackTrace();
}
}
public static void parseRequestUrl(String url) throws IOException {
Connection con = Jsoup.connect(url); // 获取请求连接
// 浏览器可接受的MIME类型。
con.header("User-Agent",
"Mozilla/5.0 (Windows NT 6.1; WOW64; rv:45.0) Gecko/20100101 Firefox/45.0");
Document doc = con.get();
Elements tds = doc.getElementsByTag("td");
for (int i = 0; i < tds.size(); i++) {
String linkText = tds.get(i).text();
if (linkText.indexOf(".") > 0) {
System.out.println("========" + linkText);
String port = tds.get(i+1).text();
System.out.println("-----------------"+port);
}
}
}
}
0 0
- 使用Jsoup 抓取页面的数据
- Android 使用Jsoup 抓取页面的数据
- 使用Jsoup 抓取页面的数据
- 使用Jsoup 抓取页面的数据
- android 使用Jsoup 抓取页面的数据
- 使用Jsoup 异步抓取页面的数据
- 使用Jsoup 抓取页面的数据
- 使用Jsoup 抓取页面的数据
- 使用Jsoup 抓取页面的数据
- 使用Jsoup 抓取页面的数据
- 使用Jsoup 抓取页面的数据
- 使用Jsoup 抓取页面的数据
- 使用Jsoup抓取页面的数据
- 使用Jsoup 抓取页面的数据
- 使用Jsoup 抓取页面的数据
- 使用Jsoup 抓取页面的数据
- 使用Jsoup 简单抓取页面的数据
- 使用JSOUP抓取页面数据
- 大数据工程师:大数据的java基础 第九周
- 文章标题
- UVA 10325 The Lottery(容斥原理)
- I’m stuck!
- java.util.concurrent包 以及 线程池的使用。
- 使用Jsoup抓取页面的数据
- inputFormat,RecordRead的理解和定制
- SWUST oj 2478 最短路问题
- 2014 打印图形
- DAY2:leetcode #2 Add Two Numbers
- Python中排序sort 、sorted和argsort函数
- maven之 build lifecycle
- boost::format小结
- GDOI'2016市选day1 —— 3. 最大值求和 (summax)