利用htmpParser获取网页内容以及网页上的图片地址
来源:互联网 发布:淘宝刷砖平台 编辑:程序博客网 时间:2024/06/16 09:17
一下代码是获取sina首页的内容
package com;import org.htmlparser.Parser;import org.htmlparser.util.NodeList;public class Html {public static void main(String []args){try{Parser parser = new Parser("http://www.sina.com.cn");parser.setEncoding("gb2312");NodeList list = parser.parse(null);System.out.println(list.toHtml());}catch(Exception e){e.printStackTrace();}}}
下面的实例是获取sina首页上的图片地址,先查询“img”标签,然后利用ImageTag获取src属性
package com;import org.htmlparser.Node;import org.htmlparser.NodeFilter;import org.htmlparser.Parser;import org.htmlparser.filters.TagNameFilter;import org.htmlparser.tags.ImageTag;import org.htmlparser.util.NodeList;public class ImageSrc {public static void main(String []args){try{Parser parser = new Parser("http://www.sina.com.cn");parser.setEncoding("gb2312");NodeFilter nodeFilter = new TagNameFilter("img");NodeList nodeList = parser.extractAllNodesThatMatch(nodeFilter);Node node = null;ImageTag imageTag = null;if(nodeList != null){for(int i=0;i<nodeList.size();i++){node = (Node)nodeList.elementAt(i);if(node instanceof ImageTag){imageTag = (ImageTag)node;System.out.println(imageTag.getAttribute("src"));}}}}catch(Exception e){e.printStackTrace();}}}
- 利用htmpParser获取网页内容以及网页上的图片地址
- 获取网页内容的email地址
- 利用HttpClient获取网页内容
- 利用MFC获取网页内容
- 利用socket获取网页内容
- 利用java获取网页内容
- php通过网页地址获取该地址下的内容
- C# 正则表达式抓取网页上某个标签的内容,并替换链接地址和图片地址
- android利用Http协议获取网页文本内容的方法
- 根据网页地址获取页面内容
- Java基础:利用HttpClient获取网页内容
- Java基础:利用HttpClient获取网页内容
- php获取网页中图片、DIV内容的简单方法
- 爬虫实例:爬取一个网页上的图片地址
- swift 获取网页中图片地址的正则表达式
- libcurl保存网页内容以及图片
- 获取html网页的内容
- 获取某一网页的内容
- PHP的ob_start();用法
- c# asc码和字母互相转换函数
- 均衡算法代码(java)(2)
- Oracle 角色管理
- SSAS处理时“找不到属性键”的解决办法
- 利用htmpParser获取网页内容以及网页上的图片地址
- js根据日期判断星座
- linux内核代码分段信息
- 插件11:上传文件
- 终于解决掉文件系统fwrite一个严重的bug
- httpclient 4.1.2 maven require
- Android内存管理分析
- CSS滤镜效果实列
- JQuery.getJSON 从aspx页面返回JSON数据 .