HTML解析器
来源:互联网 发布:黄金 知乎 编辑:程序博客网 时间:2024/04/23 20:55
jsoup 1.5.1 发布,超棒的HTML解析器
作者: Claymore 时间: 2011-02-20 20:36:31
Arial Tahoma Verdana宋体 楷体 字体减小 字体加大
该版本增加单个 pass 选择器用于所有复杂查询,另外使用 CSS 选择器从 DOM 中提取元素的性能得到显著的提升,修复了 Scala 支持的bug,提供新的 HTML 操作特性以及bug修复。
jsoup 是一款 Java 的HTML 解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于JQuery的操作方法来取出和操作数据。
jsoup的主要功能如下:
- 从一个URL,文件或字符串中解析HTML;
- 使用DOM或CSS选择器来查找、取出数据;
- 可操作HTML元素、属性、文本;
jsoup是基于MIT协议发布的,可放心使用于商业项目。
示例代码:
File input = new File("/tmp/input.html");Document doc = Jsoup.parse(input, "UTF-8", "http://example.com/");Element content = doc.getElementById("content");Elements links = content.getElementsByTag("a");for (Element link : links) { String linkHref = link.attr("href"); String linkText = link.text();}
- HTML解析器 jsoup
- HTML解析器
- HTML解析器 jsoup
- Python3 HTML 解析器
- HTML解析器 jsoup
- HTML解析器
- HTML 解析器
- HTML 解析器 Jericho
- JSoup HTML解析器
- python HTML解析器
- HTML解析器--jsoup
- html解析器比较
- JSoup HTML解析器
- html解析器 HtmlAgilityPack
- HTML解析器 jsoup
- MHtmlDomMaster-------Html解析器
- Delphi HTML解析器
- HTML 解析器
- [Extjs] FormPanel 中button的disabled控制
- RPR弹性分组环(2003年文章)
- Android 之 Bluetooth
- 从log文件中查询错误的点点滴滴
- Xcode4.2 EXC_BAD_ACCESS
- HTML解析器
- CSocket文件传输 分段传输的关键代码
- java运算符
- 呆B笑话集锦大全(超强爆笑)
- sersync2+Rsync 同步文件
- DBA日常维护SQL整理
- 在自己强大之前,不要奢望别人主动帮助你
- 用于Lucene的各中文分词比较
- WEB前端开发规范文档