Jsoup总结

来源:互联网 发布:优酷视频下载器 mac 编辑:程序博客网 时间:2024/05/01 15:31

最近使用了Jsoup,感觉还是挺简单,挺方便的,轻而易举地使用java像jQuery一样操作html节点,轻松抓取网页源码,分析获取各个标签所需的东西。


对于采集网页类具有相当方便的作用


具体可看下面各个相关例子:

Jsoup下载地址:

http://jsoup.org/download


jsoup开发指南,jsoup中文使用手册,jsoup中文文档:
http://www.open-open.com/jsoup/


jsoup抓取网页+详细讲解 - 玩转java - 博客频道 - CSDN.NET
http://blog.csdn.net/yjflinchong/article/details/7743995


java 使用Jsoup登录网站抓取网页内容 - 为程序员服务
http://outofmemory.cn/code-snippet/1721/usage-Jsoup-denglu-web-site-zhuaquwangye-content


使用Htmlparser|Jsoup|正则表达式抽取网页链接 - changfengmingzhi的日志 - 网易博客
http://changfengmingzhi.blog.163.com/blog/static/16710528820137144434343/


java+Jsoup 正则过滤html网页标签【多线程数据采集之二】 - 玩转java - 博客频道 - CSDN.NET
http://blog.csdn.net/yjflinchong/article/details/8120654


但本人使用之后,还是感觉Jsoup有点小缺陷,就是不能很好地结合webView进行操作webView中的html。不知是我没找到方法还是本身就是结合不了webView。

像一些登陆后操作就比较麻烦,例如需要验证码之类的,直接就获取不了html了。

0 0