Jsoup使用总结
来源:互联网 发布:python3.5 socket编程 编辑:程序博客网 时间:2024/05/22 00:13
Jsoup是对网页进行解析的工具:
首先通过网页地址获取网页的数据(String格式),然后就是使用jsoup将进行对结点解析:
//解析html成Document
public static Document getDocument(String html){
Document doc = Jsoup.parse(html);
return doc;
}
//这是三个节点:超链接,图片地址,还有p是段落的标签,我就做了三个,其他可以百度
public class HtmlSelector {
public static String href = “a”;
public static String img = “img[src]”;
public static String p = “p”;
}
//解析Doc,htmlSelector 是HtmlSelector中的参数
public static Elements getElement(Document doc,String htmlSelector ){
Elements links = doc.select(htmlSelector );
return links;
}
//提供获取超链接的模板,其他类似,都是根据attr(arg)方法,对于img标签获取图片地址是attr(src),p标签更简单直接用text()方法就可以获取其中的文字
public static List getData(Document doc){
List list = new ArrayList();
Elements href = getElement(doc,HtmlSelector.href);
for (Element e1:href){
YelloObj ye = new YelloObj();
//只要超链接,在上下页用到
String h = e1.attr(“href”);
String t = e1.text();
//Log.e(“Main”, “获取的文字: “+t);
if (h.endsWith(“.htm”)) {
ye.setYelloHref(h);
ye.setYelloText(t);
list.add(ye);
}
return list;
}
- Jsoup使用总结
- Jsoup使用总结
- 使用jsoup的几点小总结
- Jsoup总结
- Jsoup总结
- jsoup总结
- Jsoup总结
- Jsoup总结
- jsoup使用
- jsoup使用
- jsoup使用
- Jsoup使用
- JSoup 代码总结
- HtmlUnit+Jsoup学习总结
- Jsoup学习总结
- Jsoup学习总结
- Jsoup学习总结
- jsoup学习总结
- 2015蓝桥杯A组C/C++第六题牌型种数
- [codevs2070]爱情之路 分层图最短路
- SAP Business One告诉您:每个企业都在经历中年危机
- AMD CMD UMD 区别
- n行n列矩阵快速幂模板
- Jsoup使用总结
- IDEA配置tomcat
- Java面试题集(1-50)
- C# winform解析.SAW输出图片实践
- squid+stunnel为docker配置代理服务器
- jQuery延迟加载(懒加载)插件 – jquery.lazyload.js
- swift中下划线怎么用
- SOLIDWORDS API修改零部件属性全部保存
- Robust Light Transport Simulation via Metropolized Bidirectional Estimators