如何采用htmlParser来获取网络资源
来源:互联网 发布:限韩令影响知乎 编辑:程序博客网 时间:2024/06/05 15:02
import org.htmlparser.NodeFilter;
import org.htmlparser.Parser;
import org.htmlparser.filters.TagNameFilter;
import org.htmlparser.util.NodeList;
/**
* Author: crazy_rain
* Date: 2007-3-13
* Time: 下午12:55:42
* Introduction:网络资源抓取器,htmlParser 使用小结
*/
public class ResourceFetcher {
public static void parseResource(String url) throws Exception {
Parser p = new Parser(url);
NodeFilter filter = new TagNameFilter("HEAD");
// NodeFilter nf = new NodeClassFilter(ImageTag.class);
// NodeFilter nf = new NodeClassFilter(BodyTag.class);
// NodeFilter nf = new NodeClassFilter(InputTag.class);
// NodeFilter nf = new NodeClassFilter(Html.class);
// NodeFilter nf = new NodeClassFilter(HeadTag.class);
// NodeFilter nf = new NodeClassFilter(LinkTag.class);
// NodeFilter nf = new NodeClassFilter(ScriptTag.class);
NodeList nl = p.extractAllNodesThatMatch(filter);
for (int i = 0; i < nl.size(); i++) {
System.out.println(nl.elementAt(i).toHtml());
}
}
public static void main(String args[]) throws Exception{
parseResource("http://www.zzu.edu.cn");
}
}
- 如何采用htmlParser来获取网络资源
- 如何利用网络资源来学习
- android获取网络资源如何解析
- 【翻译】Python如何使用urllib2获取网络资源
- Python如何使用urllib2获取网络资源
- 获取网络资源
- [Python系列实用教程]一、Python如何使用urllib2获取网络资源
- [Python系列实用教程]一、Python如何使用urllib2获取网络资源
- [Python系列实用教程]一、Python如何使用urllib2获取网络资源
- [Python系列实用教程]一、Python如何使用urllib2获取网络资源
- 如何使用urllib获取网络资源(Python 3)
- HtmlParser 获取文本信息
- 通过HTTP获取网络资源
- 通过URL获取网络资源
- android 获取网络资源
- android 获取网络资源
- 通过HTTP获取网络资源
- URL 获取网络资源
- 网络 命令
- 初来驾到
- 使用eclipse构建一个struts+spring+hibernate系统
- asp.net提高性能的要点
- 字符画软件的四个关键技术
- 如何采用htmlParser来获取网络资源
- 获取字体点阵
- SQL 如何将getdate() 的 含有时间的格式转化为只有日期的短日期格式
- 在ASP.NET中创建安全的站点
- iisreset 命令清除iis死机
- ASP.NET 中执行 URL 重写
- 常用JS(INPUT)
- MySQL replace statement
- SQL 日期函数相关