Jsoup爬取网页上表格数据
来源:互联网 发布:high mysql pdf 编辑:程序博客网 时间:2024/05/16 09:32
首先,先下载jsoup的jar包,这个自己去网上搜一下吧,好多的,然后导入到程序中,方便使用。
下来,先得到你要获取的网页的内容,Document doc = Jsoup.connect(url).timeout(5000).get();
这里面的url就是你要爬取的网址,timeout(5000)设置了你爬取网页的最大时间,超出时间后就不再尝试了,一般网站不用设置的,只需要Document doc = Jsoup.connect(url).get();就可以获取该网页的内容,转为文档格式。
接下来,就是寻找你要获取的数据,这里主要讲网页中表格的数据如何获取,其他的类似。
你要明白你所要获取网页的html标签的结构,按F12进入开发者模式,寻找你所要获取的数据信息。
如果网页上只有一个表格,那就简单了:Elements elements1 = doc.select("table").select("tr");这一行代码就获得了网页上的表格中的行,返回的elements是该表格有多少行,如果是多个表格,那么select()中的是该表格的标签,如它的class等属性,以确定你选择的是哪一个表格。
for (int i = 0; i < elements1.size() - 1; i++) {
//获取每一行的列
Elements tds = elements1.get(i).select("td");
{
//对每一行中的某些你需要的列进行处理
//获取第i行第j列的值
String oldClose = tds.get(j).text()
//接下来,进行你的操作
………………
}
}
- Jsoup爬取网页上表格数据
- jsoup爬取网页数据
- Android Jsoup 爬取网页数据
- java Jsoup 爬取网页数据
- java-jsoup自适应爬取网页表格的内容
- 【Jsoup爬取网页内容】
- jsoup爬虫爬取网页
- Android Jsoup 爬取网页
- python爬虫爬取网页表格数据
- jsoup爬取表格中的内容
- 利用Jsoup爬取网页内容
- 利用Jsoup爬取网页内容
- 利用jsoup爬取网页信息
- Fiddler+JSoup爬取现代汉语语料库数据
- jsoup抓取网页上的数据,Android同时获取数据
- jsoup 分析网页数据
- jsoup 抓取网页数据
- Jython使用jsoup爬取网页标题与链接信息
- C代码从GCC到MSVC的移植
- Linux日常使用命令累积
- 把输入流inputstrean转换成字符串string
- android:background="@drawable/"图片拉伸问题
- Qt中信号和槽机制
- Jsoup爬取网页上表格数据
- leetcode刷题系列C++-single number II
- 1032. Sharing (25)
- shell脚本基础知识和位置变量
- centos下配置nginx服务器更改根目录
- CSS padding margin border属性详解
- 二维码扫描ios开发
- const的注意事项
- 支付宝pc即时支付兼容app移动支付异步回调函数验证