用HTMLParser提取URL页面超链接的一段代码
来源:互联网 发布:数据挖掘算法pdf 编辑:程序博客网 时间:2024/05/20 06:55
转载自:http://topstar.blog.51cto.com/693408/14086
package htmlparser;import java.util.HashMap;import java.util.Map;import org.htmlparser.Node;import org.htmlparser.NodeFilter;import org.htmlparser.Parser;import org.htmlparser.tags.LinkTag;import org.htmlparser.util.NodeList;public class GetLinkTest{ public static void main(String[] args) { try { // 通过过滤器过滤出<A>标签 Parser parser = new Parser("http://www.google.cn"); NodeList nodeList = parser .extractAllNodesThatMatch(new NodeFilter() { // 实现该方法,用以过滤标签 public boolean accept(Node node) { if (node instanceof LinkTag)// 标记 return true; return false; } }); // 打印 for (int i = 0; i < nodeList.size(); i++) { LinkTag n = (LinkTag) nodeList.elementAt(i); System.out.print(n.getStringText() + " ==>> "); System.out.println(n.extractLink()); } } catch (Exception e) { e.printStackTrace(); } }}
0 0
- 用HTMLParser提取URL页面超链接的一段代码
- 从html文件中提取超链接URL的shell脚本
- 一段找出URL的代码(C#)
- URL的一段测试代码(转)
- 正则表达式应用--提取CSDN所有下载资源页面URl的思路与代码实现
- 提取超链接的正则
- 一段javascript的页面搜索代码
- 一段代码得到本页面的文件名
- 一段javascript的页面搜索代码
- 根据htmlparser写的一个提取页面纯文本的C#程序
- 一段提取用户名和md5的代码编程
- 关于HtmlParser提取标签不完整的问题(HtmlParser扩展)
- 题型:编写一段JS代码提取URL中的各个GET参数,并按Key_Value的形式返回到一个对象中(如:Json结构)
- 使用HTMLParser提取新闻的例子
- 分享一段php判断url http状态码的代码
- 超链接提取的正则表达式
- 提取网站上的超链接
- htmlparser操作bean类提取html页面元素
- Ubuntu下搭建PHP环境
- 各种内部排序算法的实现
- windows系统端口监听
- hdu 4539 郑厂长系列故事——排兵布阵 状态压缩dp
- 被忽略的java.io.StreamTokenizer
- 用HTMLParser提取URL页面超链接的一段代码
- java--统计被import最多的类
- http://blog.csdn.net/cmdkmd/article/details/17242191
- 六级指针小试牛刀
- 引用 && const 要注意的一些地方
- HDU1874畅通工程续 (Dijkstra算法求最短路)
- Ehcache 整合Spring 使用页面、对象缓存
- [原创]一点一滴学习网络游戏开发,第一章节:初步了解ACE和SOCKET
- java--