Jsoup入门
来源:互联网 发布:702qq.com域名更改为 编辑:程序博客网 时间:2024/05/21 21:41
简介
jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据。主要作用是 用HttpClient获取到网页后 具体的网页提取需要的信息的时候 ,就用到Jsoup,Jsoup可以使用强大的类似Jquery,css选择器,来获取需要的数据;
HttpEntity entity=response.getEntity(); // 获取返回实体String webContent=EntityUtils.toString(entity, "utf-8"); Document doc=Jsoup.parse(webContent); Elements elements=doc.getElementsByTag("title");Element element=elements.get(0);String title=element.text();System.out.println("网页标题是:"+title)
通过一个字符串获取一个document对象,通过dom解析获取内容
再举例一些常用的方法
getElementById(String id) 根据id来查询DOMgetElementsByTag(String tagName) 根据tag名称来查询DOM
getElementsByClass(String className) 根据样式名称来查询DOM
getElementsByAttribute(String key) 根据属性名来查询DOM
getElementsByAttributeValue(String key,String value) 根据属性名和属性值来查询DOM
还有一种封装过的方法 Jsoup也可以使用css jquery选择器方式获取元素节点Document doc= Jsoup.connect("http://www.evafjs.cn").get();
Element e = doc.select("选择器");
我感觉Jsoup和js操作dom树差不多,有js的基础就好了
针对Json数据的解析,这里我建议一款快速解析工具fastjson(阿里开源的一个工具)
阅读全文
0 0
- Jsoup入门
- Jsoup入门
- Jsoup入门
- Jsoup入门
- Jsoup入门
- Jsoup入门
- jsoup入门
- jsoup Cookbook(中文版) 入门
- Jsoup入门指南
- Jsoup入门-java
- 01-jsoup入门
- 爬虫之jsoup入门指南
- Jsoup官方教程(一)【入门】
- JSoup入门笔记--------java HTML 解析库
- Jsoup入门:解析html 抽取数据
- Java爬虫入门之Jsoup使用
- jsoup
- jsoup
- SWFUpload文件上传
- LeetCode
- SPFA-浪里个浪
- 使用keil5的USB::CDC类实现虚拟串口和SPI通讯
- 走进MyBatis的世界
- Jsoup入门
- python解析pdf文件
- 小石头UI自动化测试框架(项目实战)python、Selenium(日志、邮件、pageobject)
- mybatis generator 生成数据库注释等问题
- Java基础小细节,面试可能会出
- 日志带参输出 The Art of Logging: Advanced message formatting
- POJO和javabean的区别
- 关于Activity的getReferrer()之一:如何在Activity中获取调用者
- 笨办法学python ex29-35