获取HTML网页的所有图片的url
来源:互联网 发布:安全的理财软件 知乎 编辑:程序博客网 时间:2024/06/05 18:05
主要使用了HtmlParser类解决问题。
必须导入htmlparser.jar包,读者可从网上自行下载。
下面直接贴上源码:
public NodeList parser(String url) throws ParserException{ /**根据Url创建parser对象**/ Parser parser = new Parser(url); /**设置编码,必须与Url编码一样 **/ parser.setEncoding("utf-8"); /** 构建一个Html页面对象 **/ HtmlPage htmlPage = new HtmlPage(parser); parser.visitAllNodesWith(htmlPage); /** 获取Body下面所有的节点,可以想象成类似树状结构 **/ NodeList list = htmlPage.getBody(); /** 建立一个Filter,用于过滤节点,此处获得形如“<img></img>”这样的节点 **/ NodeFilter filter = new TagNameFilter("IMG"); /** 得到过滤后的节点 **/ list = list.extractAllNodesThatMatch(filter, true); for(int c =0; c < list.size(); c ++){ ImageTag imageTag=(ImageTag)list.elementAt(c); /** 输出图片的链接Url **/ System.out.println(imageTag.getImageURL()); } return list; } public static void main(String[] args) throws ParserException { Demo demo = new Demo(); demo.parser("http://www.163.com"); }
输出结果就是一堆图片的链接了。
- 获取HTML网页的所有图片的url
- 一条JavaScript语句获取当前网页所有图片的url
- 获取网页所有的url 正则
- 获取指定URL网页的HTML代码
- ios webview 获取 网页的URL、title和HTML
- 用URL获取网页上的HTML文件
- 获取本站点网页的html代码与任意URL网页的html代码
- 正则表达式获取网页中所有图片的路径
- asp.net 获取html代码中图片的URL地址
- C#获取网页的HTML码、下载网站图片
- C#获取网页的HTML码,下载网站图片
- 根据网页的URL获取网页信息
- js获取网页所有图片
- 获取网页的html文本
- 获取html网页的内容
- UIWebview获取网页中所有图片并加入点击事件,实现浏览图片的效果
- iOS-获取当前网页的 url 和 title 和 html
- 获取所有IE当前浏览的Url
- JDK动态代理实现原理
- 有关FTP 的学习
- Chromebook for Poor Devs
- android组件
- C++老话题:用指向函数的指针作函数参数
- 获取HTML网页的所有图片的url
- c++参数调用方式的逆向
- 写工具的一些链接
- C++友元
- 物理standby转换为逻辑standby的步骤
- 继承 多态 虚函数
- android sqlite新添唯一键constraint错误的解决方法
- 启动centos 设置vsftp连接
- jsp中实现分页