简易爬虫抓取网页内容并写入文本
来源:互联网 发布:java流程管理系统 编辑:程序博客网 时间:2024/06/08 00:32
最近学习lucene,涉及爬虫。通过网络资源包抓取网络资源,附上代码:
public class Dsfa {public static void main(String[] args) {HttpClient client = new HttpClient();GetMethod getMethod = new GetMethod("http://blog.csdn.net/luo_da/article/details/76135572");getMethod.getParams().setParameter(HttpMethodParams.RETRY_HANDLER,new DefaultHttpMethodRetryHandler());try {int statusCode = client.executeMethod(getMethod);if (statusCode != HttpStatus.SC_OK) {System.out.println("获取失败..." + getMethod.getStatusLine());}byte[] responseBody = getMethod.getResponseBody();FileOutputStream fileOutputStream = new FileOutputStream("content.txt");// 将文件读取到本地文本fileOutputStream.write(responseBody);fileOutputStream.close();} catch (HttpException e) {e.printStackTrace();System.out.println("获取失败,请重新获取...");} catch (IOException e) {e.printStackTrace();} finally {getMethod.releaseConnection();}}}
进行网络资源,需要用到的包:
commons-codec-1.10.jar
commons-httpclient-3.1.jar
commons-logging-1.1.1.jar
资源下载地址:http://download.csdn.net/detail/luo_da/9912913
阅读全文
0 0
- 简易爬虫抓取网页内容并写入文本
- CURL 爬虫,抓取网页并写入文件
- python多线程抓取网页内容并写入MYSQL
- 用java从网络上抓取HTML文件内容并写入本地文本中
- 用java从网络上抓取HTML文件内容并写入本地文本中
- JAVA使用爬虫抓取网站网页内容
- Python简易爬虫--抓取任意数目百度百科内容
- 三十二、scrapy爬虫抓取网页写入mysql数据库
- 网页爬虫WebCrawler(1)-Http网页内容抓取
- 爬虫记录(1)——简单爬取一个页面的内容并写入到文本中
- ObjC利用正则表达式抓取网页内容(网络爬虫)
- ObjC利用正则表达式抓取网页内容(网络爬虫)
- ObjC利用正则表达式抓取网页内容(网络爬虫)
- ObjC利用正则表达式抓取网页内容(网络爬虫)
- ObjC利用正则表达式抓取网页内容(网络爬虫)
- ObjC利用正则表达式抓取网页内容(网络爬虫)
- java爬虫(使用jsoup设置代理,抓取网页内容)
- 第一个爬虫实例-简单抓取网页内容
- 第一次写博客,就来个创建springboot项目吧
- PAT 乙级 1067.试密码(20)
- java基础之HTML
- Caffe 中 的工具以及trick
- Hibernate查询部分字段并封装到指定类中(HQL)
- 简易爬虫抓取网页内容并写入文本
- androidstudio 优化编译速度(测试有效)
- 是时候思考一下到底要不要干程序员了
- nohup和&后台运行,进程查看及终止
- table 添加表行的底部边框、定制表格边框
- HDU6047 Maximum Sequence(思路)
- Mac平台重新设置MySQL的root密码
- 1019. Number Sequence
- 语义分析相关应用的实作要点