爬虫技术(2)--抓取网页java代码实现
来源:互联网 发布:betternet mac 下载 编辑:程序博客网 时间:2024/06/02 01:59
package creeper.part1.capturepage;import java.io.IOException;import org.apache.http.HttpEntity;import org.apache.http.HttpResponse;import org.apache.http.client.ClientProtocolException;import org.apache.http.client.ResponseHandler;import org.apache.http.client.methods.HttpGet;import org.apache.http.impl.client.CloseableHttpClient;import org.apache.http.impl.client.HttpClients;import org.apache.http.util.EntityUtils;//爬虫技术(1)--抓取网页@SuppressWarnings("unused")public class capturePage {public static void main(String[] args) throws Exception {//声明一个HttpClient客户端,相当于打开一个浏览器(4.3以后都是CloseableHttpClient以前的已经过时)CloseableHttpClient httpClient=HttpClients.createDefault();//创建代理,省略...try {//get方法,相当于打开了一个网页String url="http://www.baidu.com";HttpGet get=new HttpGet(url);System.out.println("---------URI----------");System.out.println(get.getURI());//创建响应处理器处理响应内容ResponseHandler<String> handler=new ResponseHandler<String>(){@Overridepublic String handleResponse(HttpResponse response)throws ClientProtocolException, IOException {int status=response.getStatusLine().getStatusCode();//获取响应状态码//对状态码进行判断处理if(status>=200 && status<300 ){HttpEntity entity=response.getEntity();//获取响应的数据return entity==null?null:EntityUtils.toString(entity);}else{throw new ClientProtocolException("status:"+status);}}};//发送请求,相当于敲个回车String responseBody=httpClient.execute(get, handler);System.out.println("----------------responseBody-----------------");System.out.println(responseBody);System.out.println("----------------responseBody-----------------");} catch (Exception e) {}finally{httpClient.close();}}}
0 0
- 爬虫技术(2)--抓取网页java代码实现
- 简单的java爬虫抓取网页实现代码(未测试)
- Java实现网络爬虫001-抓取网页
- Java抓取网页爬虫
- Java爬虫抓取网页
- 爬虫技术(1)--抓取网页
- Python 实现网络爬虫 抓取静态网页【代码】
- java抓取网页 --- 网络爬虫
- Java爬虫网页抓取图片
- java代码抓取网页
- java抓取网页代码
- 网页爬虫抓取URL简单实现
- 1、java网页抓取技术
- java爬虫实现数据抓取
- Java爬虫——抓取静态网页
- JAVA使用爬虫抓取网站网页内容
- 网页爬虫,HttpClient+Jericho HTML Parser 实现网页的抓取
- 网页抓取:PHP实现网页爬虫方式小结
- CentOS7配置samba共享服务
- JAX-RS入门 二 :运行
- Unity3D异步加载游戏场景
- 深入浅出 - Android系统移植与平台开发(五)- 编译Android源码
- popen 函数
- 爬虫技术(2)--抓取网页java代码实现
- Hive知识点笔记-影印版
- RippleEffect波纹效果
- [精通Objective-C]对象和消息传递
- 解决Andriod全屏时软键盘出现不能把原来的布局给顶上去的方法
- hdu_4718_The LCIS on the Tree(树链剖分+线段树合并)
- 【Struts2】:Struts2的类型转换
- Scala:日期和时间
- Linux之C语言笔记