使用jsoup对HTML文档进行解析和操作
来源:互联网 发布:windows连接git服务器 编辑:程序博客网 时间:2024/05/16 16:24
最近做项目需要在java里面解析html标签,听人说jsoup好用,就用了下。
网上搜了下用法,发现都是复制粘贴,就打算自己总结一个。
我当时maven的最新包
<dependency><groupId>org.jsoup</groupId><artifactId>jsoup</artifactId><version>1.11.2</version></dependency>
//所有的对象都是Jsoup包中的。Document doc = Jsoup.parse("HTML字符串");//html转换成documentElements img = doc.select("img[src^=http://baidu.com]");//使用过滤器获取想要的标签集合for (int i = 0; i < img.size(); i++) {//遍历标签集合 Element node = elements.get(i);//获取每一个标签 String src = node.attr("src");//获取属性 node.attr("src","http://blog.csdn.net/hjgzj");//给属性赋值}System.out.println(doc.toString());//打印修改后的HTML
代码中最重要的是过滤器,这个过滤器跟jQuery用法很像,我就对比总结了一下
如果精通jQuery,那么知道上面这些就够了,你可以任意组合匹配你想要得到的标签。
[]是属性过滤器,你可以根据属性获取标签,如果需要同时满足多个属性的时候,就多写几个[]然后并列就可以了。
如:需要得到value=hello,type=text的input,那么把过滤器组合起来就可以了:"input[value=hello][type=text]"
选择器之间也可以加逗号",",表示或的关系。
如:需要得到value=hello,type=text的input或者src以/a开头的img,这样写就可以了"input[value=hello][type=text],img[src^=/a]",这种写法类似jQuery的$("#id1,#id2")
最常用的就是这几个:属性选择器:[attr=vla],类选择器:.class,标签选择器:input,ID选择器#ID:
还有其他的选择器,我看了下其实不太常用,就不写了,有兴趣看下http://www.open-open.com/jsoup/selector-syntax.htm
阅读全文
0 0
- 使用 jsoup 对 HTML 文档进行解析和操作
- 使用 jsoup 对 HTML 文档进行解析和操作
- 使用 jsoup 对 HTML 文档进行解析和操作
- 使用 jsoup 对 HTML 文档进行解析和操作
- 使用 jsoup 对 HTML 文档进行解析和操作
- 使用 jsoup 对 HTML 文档进行解析和操作
- 使用 jsoup 对 HTML 文档进行解析和操作
- 使用 jsoup 对 HTML 文档进行解析和操作
- 使用 jsoup 对 HTML 文档进行解析和操作
- 使用 jsoup 对 HTML 文档进行解析和操作
- 使用 jsoup 对 HTML 文档进行解析和操作
- 使用 jsoup 对 HTML 文档进行解析和操作
- 使用 jsoup 对 HTML 文档进行解析和操作
- 使用 jsoup 对 HTML 文档进行解析和操作
- 使用 jsoup 对 HTML 文档进行解析和操作
- 使用 jsoup 对 HTML 文档进行解析和操作
- 使用 jsoup 对 HTML 文档进行解析和操作
- 使用 jsoup 对 HTML 文档进行解析和操作
- 辉煌十载!BDTC 2017 中国大数据技术大会在京盛大召开
- Android进阶——布局优化之灵活借助ViewStub实现懒加载
- Linux下的一些重要目录/proc, /sys, /SElinux, /bin, /usr/lib, /usr/local, /var, /tmp/etc
- 防止form表单重复提交的八种方法
- base64图片
- 使用jsoup对HTML文档进行解析和操作
- [洪流学堂]Hololens开发:Unity3d与Visual Studio最佳实践
- GIT删除子模组
- 云付刷卡安全吗?
- 关于屏幕适配的理解
- 跑酷类小demo
- 剑指Offer 面试题27:二叉树的镜像 Java代码实现
- 2017年12月7号培训笔记
- [Steam]SteamDirect开发者的使用参考