【Jsoup学习礼记】使用DOM方法来遍历一个文档
来源:互联网 发布:生物多样性保护网络 编辑:程序博客网 时间:2024/05/21 22:54
问题
你有一个HTML文档要从中提取数据,并了解这个HTML文档的结构。
方法
将HTML解析成一个Document
之后,就可以使用类似于DOM的方法进行操作。示例代码:
File input = new File("/tmp/input.html");Document doc = Jsoup.parse(input, "UTF-8", "http://example.com/");Element content = doc.getElementById("content");Elements links = content.getElementsByTag("a");for (Element link : links) { String linkHref = link.attr("href"); String linkText = link.text();}
说明
Elements这个对象提供了一系列类似于DOM的方法来查找元素,抽取并处理其中的数据。具体如下:
查找元素
getElementById(String id)
getElementsByTag(String tag)
getElementsByClass(String className)
getElementsByAttribute(String key)
(and related methods)- Element siblings:
siblingElements()
,firstElementSibling()
,lastElementSibling()
;nextElementSibling()
,previousElementSibling()
- Graph:
parent()
,children()
,child(int index)
元素数据
attr(String key)
获取属性attr(String key, String value)
设置属性attributes()
获取所有属性id()
,className()
andclassNames()
text()
获取文本内容text(String value)
设置文本内容html()
获取元素内HTMLhtml(String value)
设置元素内的HTML内容outerHtml()
获取元素外HTML内容data()
获取数据内容(例如:script和style标签)tag()
andtagName()
操作HTML和文本
append(String html)
,prepend(String html)
appendText(String text)
,prependText(String text)
appendElement(String tagName)
,prependElement(String tagName)
html(String value)
0 0
- 【Jsoup学习礼记】使用DOM方法来遍历一个文档
- jsoup使用DOM方法来遍历一个文档
- 【jsoup】使用DOM方法来遍历一个文档
- jsoup教程006-使用DOM方法来遍历一个文档
- 【Jsoup学习礼记】解析和遍历一个HTML文档
- 【使用JSOUP实现网络爬虫】使用DOM方法来遍历一个文档
- 【使用JSOUP实现网络爬虫】使用DOM方法来遍历一个文档
- jsoup Cookbook——使用DOM方法来遍历一个文档
- 使用DOM方法来遍历一个文档
- 【Jsoup学习礼记】从一个文件加载一个文档
- 【Jsoup的学习礼记】使用选择器语法来查找元素
- 【Jsoup学习礼记】解析一个HTML字符串
- 【Jsoup学习礼记】解析一个body片断
- 【Jsoup学习礼记】从一个URL加载一个Document
- 【jsoup的学习礼记】设置一个元素的HTML内容
- 【Jsoup学习礼记】处理URLs
- 【Jsoup学习礼记】消除不受信任的HTML (来防止XSS攻击)
- 【Jsoup学习礼记】设置属性的值
- VC托盘程序
- jstl与el表达式 和面向对象
- OpenCv轮廓高级应用(轮廓匹配,几何直方图)
- Java集合学习笔记
- BroadcastReceiver 的基本使用方法
- 【Jsoup学习礼记】使用DOM方法来遍历一个文档
- android notification的支持
- iOS开发UI篇—实现一个私人通讯录小应用(二)
- 设置MATLAB中的“To workspace”模块
- 黑马程序员--Java基础--集合框架
- 风在哪
- UML-时序图和活动图
- C语言实现双字节在数组中按比特位移动
- PHP加密技术