最简单的网络爬虫(用到了htmlparser,httpClient)

来源:互联网 发布:淘宝拍图用什么相机好 编辑:程序博客网 时间:2024/04/27 14:07

目录结构

 

第一步:

com.webcrawler.util.Queue.java

 

第二步:

com.webcrawler.util.LinkQueue.java

 

第三步:

com.webcrawler.util.LinkFilter.java

 

第四步:

com.webcrawler.util.HtmlParserTool.java

 

第五步:

com.webcrawler.util.DownloadFile.java

 

第六步:

com.webcrawler.test.MainCrawler.java

 

That's all.

 

所有jar包在

http://download.csdn.net/source/3136181

原创粉丝点击